thesis

Reformulation dans un système de recherche documentaire

Defense date:

Jan. 1, 2005

Edit

Institution:

Angers

Disciplines:

Authors:

Directors:

Abstract EN:

This thesis presents the research made on questions semantic re-phrasing or reformulation, aiming at improving the results gotten from information retrieval systems. The interrogation of textual corpus traditionally consists of requests based on key words. This approach as well as the statistic processing usually used to meet the user's need, seem to have reached their limit with regards to the quality of outcoming answers. Moreover, the techniques used to answer requests set on key-words are inadequate to question-answering systems, where the goal is to provide the most accurate answer to a question asked in natural language. The approach applied in this report consists of a question re-phrasing drawn on a semantic analysis. The user's need leads the answering research process. The thesis is divided in three parts, starting with the state of the art of information retrieval and questionanswering systems. The second part provides the details on linguistic back-ups used to answer the questions. The last part finally presents the architecture of the implemented system as well as the different stages of questions re-phrasing process.

Abstract FR:

Cette thèse présente les travaux de recherche menés sur la reformulation sémantique des questions afin d'améliorer les résultats des systèmes de recherche d'information. Traditionnellement, l'interrogation de corpus de données textuelles s'appuie sur la formulation de requêtes par mots-clés. Cette approche ainsi que les traitements statistiques employés pour répondre au besoin d'information de l'utilisateur semblent avoir atteint leur limite quant à la qualité des réponses proposées. De plus, les techniques utilisées pour répondre aux requêtes par mots-clés sont inadaptées aux systèmes de question-réponse où il s'agit de répondre précisément à des questions exprimées en langage naturel. L'approche retenue dans ce mémoire vise à reformuler la question en s'appuyant sur une analyse sémantique de celle-ci. Ce processus de recherche de la réponse est guidé par la nature même du besoin de l'utilisateur. La structure de ce document peut être décomposée en trois parties. Tout d'abord, un état de l'art de la recherche d'information et des systèmes question-réponse est proposé. La deuxième partie expose en détail les ressources linguistiques utilisées pour répondre aux questions. Enfin, la dernière partie présente l'architecture du système développé ainsi que les différentes étapes du processus de reformulation des questions.