thesis

La recherche d'information dans des bases de documents techniques en texte integral. Etude de l'activite des utilisateurs

Defense date:

Jan. 1, 1997

Edit

Disciplines:

Directors:

Abstract EN:

This thesis is about information retrieval (ir) in full-text databases, and it particularly deals with information retrieval by expert users in technical documents. We suggest that the design of an ir system in technical document, should be approached by studying users' needs and expectations. We first present a state of art about ir and about the particularities of information retrieval in full-text. Then, experimental studies are led to approach the expert users' needs and expectations in case of information retrieval in technical documents, and a study of ir systems in full-text technical documents shows that these systems do not completely meet the users'needs. We so suggest that we should take the linguistic particularities of technical texts into account in order to improve ir in full technical documents. A psychological and linguistical study shows that a technical text is composed of two types of textual units. The first one describes and defines objects (object type) and the second one describes how to do an action (action type). These two types are validated by a cognitive study and present linguistical marks which can be automatically recognised. Both the study of users' needs and the study of linguistical characteristics of technical text, allow us to make propositions for the conception of a ir system in technical documents.

Abstract FR:

Le travail presente est consacre a la recherche d'information en texte integral, et s'interesse plus particulierement a la recherche d'information menee par des utilisateurs experts dans des documents techniques volumineux. Ce travail propose une reflexion sur la conception d'un systeme automatise de recherche d'information dans un document technique, et utilise une demarche qui se fonde sur une etude des besoins et des attentes des utilisateurs. Apres avoir presente un etat de l'art sur la recherche d'information textuelle automatisee, l'auteur montre les specificites de la recherche d'information en texte integral, et notamment le fait que ce type de recherche d'information pose une problematique nouvelle par rapport a la recherche documentaire classique. Des travaux experimentaux de psychologie cognitive permettent d'apprehender les besoins et attentes des utilisateurs en matiere de recherche d'information dans les documents techniques. Parallelement, il est etabli que les systemes existants ne repondent pas completement aux besoins des utilisateurs. L'auteur suggere alors que la prise en compte des caracteristiques linguistiques du texte technique peut permettre d'ameliorer ce type de recherche d'information. Une etude combinant les approches cognitives et linguistiques montre que le texte technique se compose de deux types d'unites textuelles: les unes decrivant ou definissant des objets (type objet) et les autres decrivant des procedures permettant la realisation d'actions (type action), qui, en plus d'etre validees par une experimentation cognitive, presentent des indices linguistiques reperables automatiquement. A partir de l'etude des besoins des utilisateurs et de l'etude des specificites linguistiques du texte technique, l'auteur etablit des propositions pour la conception d'un systeme de recherche d'information dans les documents techniques volumineux.