Une métagrammaire pour les noms prédicatifs du français : développement et expérimentations pour les grammaires TAG
Institution:
Paris 7Disciplines:
Directors:
Abstract EN:
In this study, we analyze " support verb - predicative noun " French combinations, known as support verb patterns (also known as light verb patterns i English). The grammar we describe is intended to cornply not only with tree adjoining grammar formalism, but also with a more abstract language called metagrammar. In order to build an accurate and realistic syntactic lexicon, we use a corpus from the French daily Le Monde (developed at Paris 7 University), so as to represent only the most productive predicative nouns. The corpus allows us as well to check the regularities of support verb patterns in contemporary French. Applying our low-level grammar to a series of test sentences enables us to make sure that sentences whose descriptions used to be impossible or unsatisfactory may be adequately parsed. Our work is divided into 3 parts. The first part is a general overview of the support verb notion. It also introduces the metagrammar concept and ends with a presentation of the grammar we design. The second part is the core of the thesis and shows how the metagrammar is organized. The third part shows lexical preferencies and ends with the evaluation of the grammar we developed.
Abstract FR:
Le but de ce travail est l'étude syntaxique des combinaisons " verbe support - nom prédicatif " en français, connues sous le nom de constructions à verbe support (CVS). Dans cette optique, nous étendons les études existantes en prenant en compte les noms prédicatifs sujet et objet indirect, et en précisant les critères de définition. Nous formalisons ensuite notre étude dans le cadre des grammaires d'arbres adjoints. La description des règles que nous développons n'est cependant pas uniquement réalisée en TAG : elle utilise un langage déclaratif de plus haut niveau, appelé métagrammaire. Afin d'enrichir le lexique syntaxique, nous nous appuyons sur le corpus Le Monde pour ne représenter que les noms prédicatifs les plus productifs. Le corpus nous permet également de vérifier que les constructions à verbe support sont des phénomènes très réguliers, et d'établir un principe de préférence (pour l'emploi de support) en cas d'ambiguïté potentielle. La thèse est divisée en trois parties. La première partie présente l'état de l'art pour l'étude linguistique des CVS, et donne un bref résumé des travaux e MG. Cette partie s'achève sur les principes linguistiques de notre analyse, et donne un premier aperçu des arbres TAG visés. La deuxième partie est dédiée à la présentation de la MG pour les CVS du français. Les trois chapitres de cette partie suivent l'organisation de la MG en dimensions. Enfin, dans la dernière partie nous établissons quelques recherches sur corpus, et expérimentons la grammaire produite avec un analyseur automatique.