Exploitation et fusion de connaissances locales pour la recherche d'informations précises
Institution:
Paris 11Disciplines:
Directors:
Abstract EN:
If present search engines allow to find documents corresponding to a large information need, they are not adapted to a precise information need, such as "Who was the president of the United States in 1978?". Question answering system aim at fulfilling such needs. The keyword request of a classical search engine is replaced by a question, thus in natural language, and the output consists in the precise answer to the question, instead of a list of documents to read. The question answering domain benefits from works in Information Retrieval (IR), but gives the user a facilitated interaction, thanks to the manipulation and comprehension of natural language of the Natural Language Processing domain (NLP). The goal of this work is to study how to access to a precise information, and in particular what characterizes an answer to a question. The level of linguistic knowledge needed for the system to recognize the link between a question and a potential answer is examined. The issue of the link between question and answer is studied on a syntactic level, in order to determine the impact of this type of knowledge in a precise information retrieval process.
Abstract FR:
Si les moteurs de recherche actuels sont efficaces pour trouver des documents correspondant à un besoin d'information large, c'est-à-dire pour fournir une liste de documents sur un sujet donné, ils répondent moins bien à un besoin d'information précise comme ``Qui était le président des Etats-Unis en 1978 ?''. Les systèmes de questions-réponses tentent de répondre à de tels besoins. La requête par mots-clefs d'un moteur de recherche classique est remplacée par une question, donc une requête en langage naturel, et la sortie est constituée de la réponse précise à la question, au lieu d'une liste de documents à parcourir. Le domaine de questions-réponses tire ainsi parti des possibilités actuelles en Recherche d'Information (RI), mais lui apporte une interaction facilitée avec l'utilisateur, grâce à la manipulation et la compréhension du langage naturel hérités du Traitement Automatique des Langues (TAL). L'objectif de ce travail est d'étudier précisément comment accéder à l'information précise recherchée, et en particulier ce qui caractérise une réponse à une question d'un point de vue du TAL. Nous nous demanderons ainsi ce que peut être une réponse à une question et quel niveau de connaissances linguistiques doit être utilisé par le système pour reconnaître le lien entre une question et une réponse potentielle. Nous nous sommes intéressée à la problématique de ce lien entre question et réponse sous un angle syntaxique, afin de déterminer l'impact de ce type de connaissances dans un procesus de recherche d'information précises.