thesis

DataWeb Bases sur XML. : Modélisation et recherche d'informations pertinentes.

Defense date:

Jan. 1, 2002

Edit

Institution:

Pau

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Nous proposons une architecture de système d'information pour le Web ; cette architecture repose sur une approche "entrepôt de données" et apporte des solutions aux problèmes posés par la migration des systèmes d'information vers le Web. Pour l'intégration de données de sources hétérogènes, nous introduisons la notion de dataweb ; un dataweb est défini comme un entrepôt de documents XML construit à partir de données issues de sources hétérogènes. Nous proposons un modèle de dataweb qui repose sur une source globale. La source globale intègre, dans un format XML, des données provenant de sources structurées et semi-structurées. Elle est complétée par un catalogue de méta-données qui permet la gestion du dataweb (consultation, interrogation, mise à jour). Pour la recherche d'informations, nous intégrons au dataweb un système de recherche d'informations pertinentes. Ce système étend les résultats obtenus dans les systèmes classiques de recherche d'informations aux documents XML. Pour tenir compte de la sémantique des données et améliorer la recherche, en particulier pour un utilisateur non expert, nous utilisons une base de concepts qui intègre une connaissance du domaine. Le modèle de base de concepts que nous proposons s'appuie sur l'utilisation d'un thesaurus du domaine et sur la notion d'unité sémantique pour associer une structure sémantique à la structure logique des documents XML. Pour la diffusion, nous proposons une méthode basée sur une approche déclarative. Elle permet la création de différentes vues du dataweb en fonction de plusieurs catégories d'utilisateurs (non-experts, experts, décideurs, etc. ). Les données contenues dans le dataweb sont diffusées à travers une (ou plusieurs) base(s) médiatique(s).