thesis

Les anaphores dans le dialogue homme-machine en langue naturelle ecrite : donnees recueillies par le magicien d'oz dans une situation de recherche documentaire

Defense date:

Jan. 1, 1992

Edit

Disciplines:

Directors:

Abstract EN:

The anaphora traditionally handled in man-machine dialogues are pronominal anaphora. In this thesis, however, the aim is to study the entires set of anaphorical phenomena that can be found in man-machine dialogues. For this, we use a corpus collected using the so-called "wizard of oz" simulation technique. We explain the experimental protocol used and detail the application context : an information retrieval system for everyman's use in a library. We also survey different existing retrieval modes for bibliographical data bases. Next, having exploited the corpus on the retrieval level (query typology, search strategies,. . . ) and on the linguistic level (suraces structures), anaphora, reference and coherence,. . . ), we express our doubts about the usability of natural language in certain situations and we also state the hypothesis of the need for a new "phraseology" for man-machine communication. Concerning natural language processing (nlp, we explain the different types of knowledge necessary for dialogue management and anaphora resolution (dialogue modeling, task modeling, dialogue dynamics,. . . ), on the basis of different linguistic approaches of anaphorical phenomena and existing work in nlp. Within the framework of the nlp work done at criss (centre for research in informatics applied to the social sciences), we then derive some rules for identifying anaphoric units.

Abstract FR:

Dans le dialogue homme-machine, les anaphores traitees traditionnellement sont les anaphores pronominales. Or, dans ce travail, il s'agit d'etudier l'ensemble des phenomenes anaphoriques dans un corpus de dialogues homme-machine recueillis par une technique de simulation dite du magicien d'oz, dont on relate le protocole experimental et ou l'on precise le contexte d'application : la recherche documentaire par le grand public ; sont passes en revue les modes de consultation des bases de donnees bibliographiques. Puis, en exploitant ce corpus d'un point de vue documentaire (typologie des requetes, strategies de recherches. . . . ) et d'un point de vue linguistique (structure de surface des enonces, anaphores, coherences, reference,. . . ), on remet en cause l'usage de la langue naturelle pour certaines situations et l'on emet l'hypothese d'une nouvelle phraselogie de la communication propre au dialogue homme-machine. Du point de vue traitement automatique, sont explicitees les differentes connaissances necessaires a la conduite du dialogue et a la resolution automatique des anaphores (modele de dialogue, modele de la tache, deroulement du dialogue,. . . Etc. ), en s'appuyant d'une part sur les differentes approches linguistiques des phenomenes anaphoriques, et d'autre part sur des travaux effectues en t. A. L. En se placant dans le cadre de l'analyse automatique de langue telle qu'elle est envisagee au centre de recherche en informatique appliquee aux sciences sociales de grenoble (criss), sont degagees des regles de reconnaissance des unites anaphoriques.