Indexation conceptuelle guidée par ontologie pour la recherche d'information
Institution:
Toulouse 3Disciplines:
Directors:
Abstract EN:
This thesis deals with the use of ontologies in information retrieval. More precisely, we aim at representing textual information (documents/queries) by means of concepts (rather than a bag of single words). This conceptual representation is based on matching document/query with ontology. Roughly, two principle propositions are developed within this framework. The first one, DocCore, proposes to represent information by means of semantic networks (called Document Semantic Cores) where the nodes represent the “most salient” concepts extracted from the document, and the arcs semantic similarity values between these nodes. In the second approach, DocTree, we use the concept hierarchy provided by the subsumption link of an ontology (is-a) to describe a document or a query by mean of sub-trees. A prototype is built and the two approaches are successfully used in the IR process.
Abstract FR:
Ce travail de thèse rentre dans le cadre de l'utilisation des ontologies dans le processus de recherche d'information de manière générale, et plus particulièrement pour une représentation conceptuelle de l'information textuelle (documents/requêtes). Deux principales propositions sont détaillées. La première proposition consiste en une approche de représentation basée sur les réseaux sémantiques et la seconde sur des structures arborescentes. Dans la première approche, DocCore, la projection d'un document sur l'ontologie permet de construire le Noyau Sémantique de Document où les nœuds représentent les concepts "importants" du document et les arcs, une valeur de proximité sémantique entre ces nœuds. Dans la deuxième approche de représentation, DocTree, on exploite la hiérarchie de concepts que procure le lien de subsomption d'une ontologie (is-a) pour décrire un document/requête sous une forme arborescente. Un prototype a été réalisé étayant le bien fondé de ce type d'approche.