Traitement automatique des anaphores en français : étude linguistique préalable
Institution:
Lyon 2Disciplines:
Directors:
Abstract EN:
This work takes place in the research of the group sydo-lyon, which principal activity deals with information retrieval system design. A text indexing of french textual corpus is set up by the description of the noun phrases extracted from the texts and of syntactic connections between these noun phrases. The anaphora resolution is very important for automatic text analysis because some anaphora build up syntactic connections between a noun phrase antecedent and an anaphoric, and anaphora is a relation which contributes to represent text content as it points out some noun phrases (themes). The main prospect of this work is to identify and formalise principles of anaphora resolution, so that they can be used in a computational process. It has so to study relations between anaphora and coreference, to index all anaphoric forms and antecedent forms, and to propose solution for automatic recognizing anaphorics and antecedents in texts. At last, we present the realisation of a program in prolog which gives a solution for personal pronouns. In conclusion, this work now can be pursued with improving resolution of personal pronouns and elaboration of an automatic analysis of others anaphorics.
Abstract FR:
Ce travail s'inscrit dans le cadre des recherches en conception de systemes d'information textuelle effectuees dans le groupe sydo-lyon. Une indexation d'un corpus homogene de textes francais est construite a partir de la description des syntagmes nominaux extraits des textes et des liens syntaxiques entre ces syntagmes nominaux. L'anaphore peut etre un de ces liens syntaxiques entre syntagmes nominaux, et de plus, elle est une relation discursive qui contribue a representer le contenu d'un texte dans le sens ou elle met en valeur certains syntagmes nominaux (themes). Le but principal de ce travail est d'identifier et de formaliser, en vue d'un traitement automatique, les principes de resolution d'anaphores et d'etudier les rapports entre l'anaphore et la coreference. Nous avons etabli une typologie des unites anaphoriques et des unites antecedentes, suivie d'une proposition pour reconnaitre automatiquement ces unites dans un texte. Enfin, un essai de mise en oeuvre automatique en prolog de la resolution des pronoms clitiques a ete realise. En conclusion, ce travail montre l'interet d'une analyse linguistique approfondie pour la recherche en conception de systeme d'information textuelle. De plus, il devra se prolonger par l'approfondissement du traitement automatique des pronoms preverbaux et par une ouverture sur le traitement des autres anaphoriques.