thesis

Contribution a l'etude de l'appariement de textes bilingues et monolingues

Defense date:

Jan. 1, 1995

Edit

Institution:

Paris 11

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Nous abordons le probleme de l'appariement des phrases et des mots de paires de textes bilingues ou monolingues. L'appariement bilingue pose le probleme de la reconnaissance de la traduction, l'appariement monolingue celui de la reconnaissance de la paraphrase. L'appariement des phrases se fonde sur l'appariement des mots qui les composent. Nous montrons que, meme partiel et entache d'erreurs, celui-ci peut conduire a un bon appariement des phrases. La solution preconisee pour les deux appariements se fonde sur une meme architecture algorithmique. L'appariement des mots est construit a partir d'un rapprochement lexico-morphologique. Il utilise pour l'essentiel des dictionnaires de transfert dans le cas de paires de textes bilingues, et des dictionnaires de synonymes dans le cas de paires de textes monolingues. Les textes apparies ne sont soumis qu'a une simple analyse morphologique. La lemmatisation est etablie de facon dynamique durant le processus d'appariement. Une etude manuelle de l'appariement a ete conduite dans deux perspectives: l'evaluation des performances d'une part et la definition des principes algorithmiques d'autre part (limitations, types des appariements a construire, nature des connaissances a mettre en uvre). En conclusion, nous retenons la difficulte du probleme souleve. Difficulte disons-nous car le probleme de l'appariement reste finalement ouvert dans plusieurs directions (groupes de mots, morphemes, etc. ), et que, d'une facon generale, criteres et tests linguistiques restent a elaborer si l'on veut en faire une operation aisement reproductible