Contribution au traitement automatique des homographies en francais
Institution:
NiceDisciplines:
Directors:
Abstract EN:
This thesis is a study on french homographs. It is an attempt to classify french lexical and structural homographs with a typological approach. The lexical homographs are classified according to the multiple parts of speech they belong to and also according to the multiple morphosyntactic variables which could be attached to them. The author also gives exemples of the mecanisms involved in determining the meaning of the lexical homographs and outlines the problem arising from non-accentuated texts. The structural homographs are divided in two groups. The first one includes some structures for which an ambiguity on the linking of the constituants is possible. The second one includes structures for which the constituants may have different syntactic functions. Two strategies to resolve homographs are discussed here. The first one aims at defining which part of speech the lexical homographs belong to by means of the use of contextual rules. Those rules are based on the linguistic information one could extract from some words preceding and or following the lexical homograph. The second outlines a modular system with a view to resolve lexical and structural homographs through an analysis of the sentence as a whole.
Abstract FR:
Ce travail presente une etude linguistique des homographies du francais. Nous proposons une classification typologique des homographies lexicales et structurales. Les homographies lexicales sont classees en fonction de la multiplicite de leur categorie du discours et de la multiplicite de leurs variables morphosyntaxiques. Les mecanismes mis en jeu pour inferer le sens des homographies lexicales et les problemes poses par les textes en majuscules non accentuees sont egalement abordes. Les homographies structurales sont reparties en deux groupes selon qu'elles peuvent induire une ambiguite sur le point de rattachement ou sur le role syntaxique d'un mot ou groupe de mots. Deux strategies de resolution des homographies sont introduites. La premiere vise a resoudre la categorie du discours des homographies lexicales au moyen de l'exploitation de regles prenant en compte les informations linguistiques extraites des mots entourant l'homographie lexicale. La seconde est l'ebauche d'un systeme faisant appel a un ensemble de connaissances linguistiques reparties dans divers modules. Le but de cette approche est de valider la faisabilite d'une analyse globale de la phrase pour resoudre en meme temps les homographies lexicales et structurales.