thesis

Prolexbase : un dictionnaire relationnel multilingue de noms propre : conception, implémentation et gestion en ligne

Defense date:

Jan. 1, 2006

Edit

Institution:

Tours

Disciplines:

Authors:

Abstract EN:

Cette thèse présente les différentes étapes de la conception et de l’implantation d’un dictionnaire électronique relationnel multilingue des noms propres, destiné à des processus automatique. Une étude de différents travaux dans le monde des dictionnaires électroniques et dans le domaine des noms propres en linguistique et en TAL nous a permis de proposer une modélisation des noms propres. Cette modélisation repose sur une architecture en deux parties : une partie indépendant des langues et une partie dépendant de la langue. La première partie est formée d’un niveau métaconceptuel, regroupant les concepts de type, de supertype et d’existence, et d’un niveau conceptuel, qui comprend le concept de nom propre conceptuel et quatre relations (la synonymie, l’hyperonymie, la méronymie et l’accessibilité). La seconde partie comprend le niveau linguistique (prolexène, alias, dérivés et les relations dépendantes de la langue) et le niveau des instances (formé de l’ensemble des formes fléchies du prolexème, des alias et des dérivés). Nous avons implémenté notre modèle sous la forme d’une base de données relationnelle. Une interface de consultation (http://tln. Li. Univ-tours. Fr/tln_prolex/prolex. Php) et une interface de consultation (http://tln. Li. Univ-tours. Fr/tln_prolexbase/) ont été développées. Nous avons créé deux formats XML (un format de requête et un format d’exportation) pour l’échange de nos données.

Abstract FR:

This thesis presents the different stage of the design and the implementation of an electronic relational multilingual dictionary of proper names for automatic process. A study of different work in the world of electronic dictionaries and in the domain of proper names in linguistic and in NLP has allowed us to propose a modelling of proper names. This modelling is based on an architecture in two parts : a common part for languages and a specific part for a given language. The first part contains a metaconceptual level, which regroups the concepts of type, supertype and existence, and the conceptual part, which regroups the conceptual proper name and four relations (the synonymy, the hyperonymy, the meronymy and the accessibility). The second part contains a linguistic level (prolexeme, aliases, derivatives and relations which depend on a language) and a instances level (with the inflected form of the prolexeme, the aliases and the derivatives). We have implemented our model through a relatoinal database. An interface of consultation (http://tln. Li. Univ-tours. Fr/tln_prolex/prolex. Php) and a collaborative work interface (http://tln. Li. Univ-tours. Fr/tln_prolexbase/) have been developed. We have created two XML format (a format of request and a format of exportation) for the exchange of our data.