thesis

Méthodes d'amélioration de la pertinence des réponses dans un système de bases de données textuelles

Defense date:

Jan. 1, 1988

Edit

Institution:

Paris 11

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Lors d'une recherche documentaire, la question que l'utilisateur pose, est exprimée à l'aide de mots qui peuvent être différents de ceux contenus dans les documents mais relatant les mêmes notions. Cela est un problème général de la paraphrase. La reformulation est une solution à ce problème. Le rôle de la reformulation est de trouver un chemin pour apparier les notions (mots, groupes de mots, expressions, phrases,. . . ) contenues dans les documents et dans la question. La reformulation consiste à localiser ces notions et à amplifier la reconnaissance de leur proximité sémantique, donc celle de la proximité sémantique entre les documents et la question. Le but est de diminuer le "silence" qui correspond à la non- proposition de documents pertinents. Cependant, la reformulation ne doit pas engendrer du "bruit" qui correspond à la proposition de documents non pertinents. La diminution du silence et du bruit permet d'augmenter la précision des réponses. Les différentes méthodes de reformulation pour améliorer la pertinence des réponses lors de la recherche documentaire, exposées dans ce travail, sont : - la normalisation ; - les mots de la même famille ; - le thésaurus ; - le correcteur de fautes d'orthographe ; - l'explicitation ; - l'apprentissage de règles de reformulation ; -et l'interrogation par partie de document. Parmi ces méthodes, la normalisation et l'explicitation sont présentées en s'appuyant sur des travaux antérieurs ; les mots de la même famille, le correcteur de fautes d'orthographe et l'interrogation par partie de document sont améliorés ; le thésaurus et l'apprentissage de règles de reformulation sont étudiés. Chaque méthode de reformulation exploite des règles de reformulation. Ces règles de reformulation sont caractérisées par un type de relation évaluant la proximité sémantique entre les mots mis en relation. Ces règles sont facilement modifiables. Le système de recherche documentaire SPIRIT qui comporte un traitement linguistique et un traitement statistique, a été utilisé pour la validation de nos expérimentations sur la reformulation. Des modifications ont été apportées au niveau du module de comparaison afin de pouvoir prendre en compte la reformulation. Un système expert est proposé pour piloter la reformulation. Les bases de connaissances sont constituées par des groupes de règles correspondant aux différentes méthodes de reformulation. Le mécanisme d'inférence est régi par des métarègles contrôlant chaque processus de reformulation ainsi que l'enchaînement de tous les processus de reformulation.