Modelisation de la suffixation pour le traitement automatique du francais : application a la recherche d'informations
Institution:
Université Stendhal (Grenoble)Disciplines:
Directors:
Abstract EN:
This work is devoted to the creation of softwares involved in the knowledge representation from texts. More precisely, we deal with information's retrieval in large corpora in relation with various technical areas. The concerned informations are more specificaly related to process so that verbs and nouns derivated from verbs have to be identified and interpreted. In this respect, this work consists in proposing a linguistic model adapted to morphological analyzer for derivation which will be further integrated in the system for french language recognition (cristal, grenoble). This analyzer must be able to segment and to interprete each derivated lexem in a simple lexem and one or several suffixes. The systematic examination of height thousand lexems whose major part is composed of deverbal nouns has provided the shape of derivational basic units. This decomposition may be interpreted following three standard levels (morphology, syntaxe ans semantic). The dictionaries of lexems and suffixes, which express synonymic relations such as suppletion and allomorphy, are independant of the applications (recognition and generation). In opposite, the derivational grammar, which allows to compute allomorphies is only devoted to recognition.
Abstract FR:
L'etude contribue a la conception d'outils informatiques permettant la comprehension et l'extraction de connaissances a partir d'un texte. Plus precisement, l'application envisagee est la recherche d'informations dans de gros corpus couvrant des domaines techniques varies. Les informations recherchees dans ces corpus portent plus specifiquement sur des processus. A ce titre, les verbes, mais aussi les noms derives de verbes doivent etre reperes et interpretes. Dans cette perspective, on developpe un modele linguistique permettant de construire un analyseur morphologique derivationnel qui doit etre integre dans le systeme de reconnaissance du francais ecrit cristal, developpe a grenoble. Cet analyseur doit segmenter et interpreter tout lexeme derive en un lexeme simple et un ou plusieurs affixes. L'exploitation systematique d'un lexique de huit mille lexemes dont la majorite sont des noms deverbaux suffixes a permis de degager la forme des unites derivationnelles - bases et suffixes - et de les interpreter en termes morphologique, syntaxique et semantique. Les dictionnaires des lexemes et des suffixes, qui rendent compte des relations de synonymie au sens large (suppletion, parasynonymie) sont decrits independamment de l'application envisagee (reconnaissance ou generation). En revanche, la grammaire derivationnelle qui permet de traiter les allomorphies est etudiee dans le cadre de la reconnaissance.