La construction de lexiques de formes flechies et l'analyse morphologique du coreen
Institution:
Paris 7Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Ce travail a pour objectif de developper un systeme d'analyse morphologique du coreen. La particularite de cette etude est qu'il repose sur un dictionnaire du coreen construit systematiquement pour cette application informatique. Les dictionnaires traditionnels, qu'ils soient destines a un usage humain ou a une consultation informatique, n'ont pas de principes formels de representation. Le systeme du dictionnaire utilise dans notre etude est par contre defini par des principes generaux. Par exemple, il ne contient pas plusieurs fois les memes entrees, c'est un des criteres formels de recensement linguistique que nous avons choisis. Le mot simple est la plus petite unite dans nos dictionnaires. Dans les phrases coreennes, il est frequent qu'une sequence delimitee par des separateurs (comme des blancs, des points,. . . ) soit composee de plusieurs mots simples. Ces mots simples peuvent etre analyses et construits comme un jeu de lego et son demontage est facile. Il n'y a pas de langues naturelles qui n'ait pas d'ambiguite. Les methodes de resolution d'ambiguite utilisees actuellement sont basees sur un calcul statistique ou sur des regles. C'est parce que la connaissance qu'on a actuellement des langues naturelles ne garantit pas la completude que l'on a dans un monde clos. Autrement dit, la connaissance linguistique ne peut pas etre accumulee automatiquement, et donc elle doit etre faite par l'etre humain. C'est un des problemes du monde ouvert. Dans notre etude donc, la connaissance linguistique est accumulee seulement par les experts humains, non par une methode statistique ou heuristique. Cela veut dire que la methode linguistique est plus assuree, meme si elle demande beaucoup de temps. L'information de desambiguisation construite par les experts humains est utilisee dans notre systeme d'analyseur morphologique. Pour la construction de l'information, il est inevitable d'analyser les structures internes ambigues qu'on observe dans les phrases reelles. Actuellem