thesis

Mecanismes pour l'elaboration automatique d'un entrepot d'informations a partir de documents semi-structures issus du web

Defense date:

Jan. 1, 2000

Edit

Institution:

Toulouse 3

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Actuellement, avec le developpement du web, on assiste a un accroissement du nombre d'applications qui exploitent des donnees issues du web. Ces applications de type olap ou datamining concernent les domaines de l'intelligence economique ou veille strategique. Alors que les informations mises a disposition sur le web sont issues de systemes d'informations generant des documents dynamiques, beaucoup restent au format html (statique). Les besoins de ces applications sont tels qu'il est necessaire de transformer ces informations dans une forme appropriee aux besoins de l'application. On se situe ici dans une problematique de conversion que l'on rencontre aussi dans la mise en uvre d'adaptateurs. Ces adaptateurs ont pour objectif de collecter les informations de differentes sources, de les fusionner, d'en construire une vue unifiee et de les integrer dans un entrepot d'informations, generalement gere par un systeme de gestion de base de donnees (sgbd). C'est dans ce contexte que se situe notre proposition, avec les finalites suivantes : ̱proposition d'une approche d'unification de representation pour des donnees issues de plusieurs sources, dans un environnement web, ̱stockage de ces informations dans un entrepot gere par un sgbd, ̱representation de ces informations en utilisant a la fois des techniques issues de bases de donnees (interrogation via un langage structure) et des systemes de recherche d'informations (sri) (interrogation via mots cles), et des systemes hypertextes (interrogation navigationnelle) pour permettre leur consultation. Le memoire rapportant les travaux realises pour atteindre ces objectifs est structure comme suit. La premiere partie traite de l'etat de l'art des domaines couvrant la problematique (la