thesis

Conception et réalisation d'un environnement de génie linguistique

Defense date:

Jan. 1, 1998

Edit

Institution:

Chambéry

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

La montée en puissance des industries de la langue est largement conditionnée par le développement de ressources linguistiques réutilisables. L’objet de la thèse est de proposer un environnement de génie linguistique à base de connaissances destine à favoriser la participation de linguistes à cet effort, sans pour autant les contraindre à devenir des spécialistes de l'informatique et du traitement automatique des langues. Cet environnement, qui fait largement appel à la notion de modélisation des connaissances, leur permet de passer de l'élaboration des ressources à leur mise en œuvre pratique dans le cadre d'applications concrètes. Grâce à l'approche adoptée, l'environnement conçu se caractérise par sa modularité ainsi que son évolutivité. On présente dans un premier temps les choix méthodologiques et pratiques qui sous-tendent la conception de l'outil, et en particulier l'articulation entre les connaissances inter- et intralinguistiques, qui est considérée comme essentielle à la fois pour la réutilisabilité des connaissances mais également pour leur mise en œuvre dans des contextes mono- et multilingues. Le formalisme des graphes conceptuels joue un rôle essentiel dans ce dispositif. Dans un second temps on évoque les différents registres de la modélisation des connaissances (connaissances sémantiques, morphologiques, grammaticales, lexicales et applicatives) en détaillant les considérations théoriques sur lesquelles celles-ci se fondent ainsi que les dispositions prises pour leur implémentation. On présente enfin un ensemble d'applications, ou les connaissances sont combinées entre elles pour traiter des problèmes aussi variés que l'extraction de données pour les industries de la langue (analyse lexicographique, analyse phraseologique, constitution de dictionnaires), l'analyse linguistique de corpus pour la recherche ou le traitement documentaire (indexation, analyse contextuelle, compréhension), la traduction a base de connaissances et l'aménagement linguistique (lexicogenese, terminologie).