thesis

Architecture d'un système à base de connaissances pour la recherche d'information et d'indexation automatique des textes

Defense date:

Jan. 1, 2003

Edit

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Ce travail s'inscrit dans le champ des sciences de l'information. Afin de répondre aux exigences actuelles imposées par la multiplication des données textuelles numériques, la thèse propose une architecture complexe, exploitant l'idée d'une convergence possible des systèmes de recherche d'information et des systèmes à base de connaissances. Les principales fonctions prévues sont : la création automatique d'un index de descripteurs textuels ; la recherche d'information dans une base de données textuelles ; l'extraction automatique des connaissances textuelles et leur représentation dans un formalisme à objets reliés en réseaux ; la recherche d'information dans la base de connaissances, exprimée librement en langue naturelle. Le texte insiste sur la description des deux dernières fonctions, dont la réalisation est possible grâce au développement d'un modèle sémantique de traitement de la langue et d'un modèle de représentation des connaissances. La complémentarité des deux modèles permet une extraction automatique du sens ancrée aux traitements de surface, ce qui favorise la généralité du système. En même temps, pour tester leur applicabilité, les modèles généraux de traitement et de représentation sont confrontés avec les spécificités d'un domaine d'application plus restreint : les textes techniques. Cette comparaison à mi-chemin entre une herméneutique technique et une étude de corpus aboutit également à la proposition de quelques solutions de traitement et de représentation pour les énoncés nominalisés et infinitifs.