offres d'emploi formations actualités contact accès annuaire intranet
Thèses >

Contribution à la modélisation de données multi-sources de type DATAWEB basé sur XML

Ousmane Sall - manuscrit

mercredi 27 janvier 2010 à 14h00


Des données de nature environnementale sur la vallée du fleuve Sénégal ont collectées depuis de nombreuses années à partir des activités des différents experts y intervenant. Ces données de nature spatio-temporelle, présentent certaines particularités sémantiques et structurelles selon les partenaires. Des moyens de collecte et de stockage divers sont utilisés, induisant ainsi pour les données une dimension structurelle de l’hétérogénéité à laquelle est apparentée une dimension sémantique liée à leur description avec un vocabulaire propre, mais contrôlé au sein de chaque partenaire.

Afin de résoudre la problématique de l’hétérogénéité structurelle, nous avons proposé l’introduction d’une phase préalable de pré-intégration par une représentation de l’ensemble des données partenaires sous XML, constituant ainsi un entrepôt de documents XML dit ici Dataweb. Nous utilisons ensuite le vocabulaire contrôlé décrivant les données de chaque partenaire et la réutilisation d’une ontologie du domaine comme un support pour la construction d’une base de connaissances. Cette base est alors générée partir du dataweb partenaire constituant ainsi un dataweb sémantique. Ce dataweb sémantique permet ainsi l’intégration sémantique et structurelle des données de chaque partenaire.

Pour l’intégration entre les différents dataweb sémantiques nous exploitons les travaux développés sur les systèmes à base de hubs en définissant une ontologie avec les concepts que chaque partenaire désire partager et à partir desquels nous constituons une ontologie globale.