thesis

Une grammaire lexicalisée d'arbres adjoints pour le français : application à l'analyse automatique

Defense date:

Jan. 1, 1991

Edit

Institution:

Paris 7

Disciplines:

Authors:

Directors:

Abstract EN:

This thesis presents the implementation of a french grammar using a formalism called tree adjoining grammar (tag). This formalism belongs to the family of unificationbased formalisms which have proved fruitful for natural language processing. We have added some constraints to the original formalism, especially a "lexicalization" constraint, which captures the philosophy of m. Gross 'lexicon-grammars. We have defined the elementary structures needed for describing a large range of syntactic french phenomena such as : subcategorization, agreement, complement clauses and unbounded dependencies, support verb constructions and idioms, different kind of relative clauses and cleft extractions, passive and extraposition. In particular we challenge the usual notion ov vp constitutants. We have defined the necessary features associated to these structures. We present for each phenomenon a detailed comparison with other formalisms such as gpsg, lfg and string grammars. We then present the parsing strategy suitable for "lexicalized" grammars and the current state of implementation of our french parser. Other applications such as paraphrasing and machine translation are also sketched.

Abstract FR:

Nous avons travaillé sur un formalisme appelé grammaires d'arbres adjoints (tag) qui appartient a la famille des grammaires d'unification mais avec la particularité d'être basé sur des structures arborescente. L'intérêt théorique est double: d'un point de vue linguistique, les tag élargissent la notion de localité et permettent de redéfinir les interactions multiples entre lexique, syntaxe et sémantique; nous avons ajouté une contrainte de lexicalisation qui les rend a même de formaliser les hypothèses qui sous-tendent les lexiques-grammaires de M. GROSS et peuvent contribuer à les préciser. D'un point de vue informatique, les tags sont un peu plus puissants que les grammaires hors contexte mais gardent des propriétés informatiques intéressantes (temps de traitement, décidabilité). Nous discutons d'abord de la pertinence de l'usage des arbres en linguistique et présentons les structures retenues pour notre grammaire du français. En particulier, nous remettons en cause la notion de groupe verbal. La couverture de la grammaire est suivante: sous-catégorisation, accord, complétives et infinitives, relatives, clivées, extra-position, clitiques, déterminants simples et complexes, circonstanciels simples et complexes, dépendances non bornées, constructions à verbe support et phrases figées. Nous comparons à chaque fois les représentations retenues en tag avec celles utilisées dans d'autres formalismes (gpsg, lfg, grammaires en chaine). Nous présentons enfin la stratégie d'analyse spécifique aux grammaires lexicalisées et l'état actuel de l'implémentation de notre analyseur.