thesis

Acquisition automatique de schémas de sous-catégorisation à partir de corpus bruts

Defense date:

Jan. 1, 2010

Edit

Institution:

Paris 13

Disciplines:

Directors:

Abstract EN:

This dissertation deals with the automatic acquisition of lexical information from corpora. We are particularly interested in the acquisition of subcategorization frames for French verbs. We designed and developed a system to acquire automatically such information. Using this system on a very large corpus, we produced a subcategorization lexicon for French. The evaluation of this resource and its comparison to other resources shows the interest of automatic methods in the creation of lexicons. We also show the adaptability of such systems and their ability to acquire quickly "specialized" linguistic resources. Finally, we explore the use of such resources for the acquisition of Levin style semantic verb classes, therefore we study the relationship between syntax and semantics.

Abstract FR:

Cette thèse de doctorat traite de l'acquisition automatique d'informations lexicales à partir de corpus. Nous nous intéressons en particulier à l'acquisition de schémas de sous-catégorisation de verbes pour le français. Nous avons mis au point un système permettant d'acquérir automatiquement ce type d'informations. L'utilisation de ce système sur un corpus de très grande taille a permis d'acquérir un lexique de sous-catégorisation pour le français. L'évaluation de cette ressource et sa comparaison à d'autres ressources montre l'apport des méthodes automatiques dans la constitution de lexiques. Nous montrons par ailleurs l'adaptabilité de tels systèmes et leur aptitude à acquérir des ressources « spécialisées » rapidement. Nous explorons enfin l'utilisation de telles ressources pour l'acquisition de classes sémantiques de verbes dans la lignée des travaux de Beth Levin, ce qui permet d'étudier les liens entre syntaxe et sémantique.