thesis

Un composant linguistique de production de phrases basé sur le formalisme des graphes conceptuels

Defense date:

Jan. 1, 1994

Edit

Institution:

Aix-Marseille 2

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Le travail que nous presentons dans cette these entre dans le cadre de la generation automatique de textes et plus exactement dans la phase generation de surface. Nous proposons un outil generique, base sur un formalisme de representation des connaissances connu et bien defini, celui des graphes conceptuels de sowa. Ce formalisme est tres approprie pour le traitement de la langue naturelle et repond bien a nos exigences; les methodes et les algorithmes que nous developpons y sont tres lies. La premiere tache du composant linguistique est le choix des mots qui expriment le contenu de la representation semantique. L'algorithme que nous proposons est base sur la generalisation, la projection et la contraction de type. Les contraintes syntaxiques qui sont attachees aux descriptions semantiques des mots evitent la production de nombreuses incoherence syntaxiques mais n'assurent pas la production de structure de surface syntaxiquement correctes. Pour verifier l'ensemble des contraintes syntaxiques, les completer par un traitement des mots de la classe fermee (article, auxiliaire, preposition) et effectuer les accords, il est necessaire de produire une structure d'arbre qui sera l'entree de la grammaire. Pour eliminer les concepts redondants et eviter de produire des phrases contenant des repetitions, nous proposons un algorithme de pronominalisation qui combine les criteres suivants: distance, morpho-syntaxe, conceptuel, contraintes intra-phrase