thesis

Methodes et outils pour l'appariement de textes bilingues

Defense date:

Jan. 1, 2001

Edit

Institution:

Paris 7

Disciplines:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Aligner ou apparier consiste a mettre en correspondance les unites de deux textes traductions. Ces unites peuvent etre de differentes tailles : phrases, syntagmes, mots composes, mots simples, caracteres etc. Cette approche trouve des applications dans de nombreux domaines comme les memoires de traduction, la traduction automatique, la recherche d'information multilingue ou encore la lexicographie. Nos travaux visaient a definir une nouvelle strategie d'appariement portant sur les phrases et les termes, avec le couple de langues francais-anglais. La premiere etape de notre travail a ete la realisation d'un systeme d'appariement de phrases. L'originalite de notre approche est l'utilisation d'un outil d'interrogation translingue pour proposer des candidats a l'appariement. Cette approche a eu l'occasion de demontrer sa robustesse et sa pertinence au cours de la deuxieme session de la campagne arcade (1997-1998) dont l'objectif est l'evaluation des systemes d'appariement. Au cours de la deuxieme etape, nous avons aborde l'appariement de termes : les unitermes puis les mots composes. Tout d'abord, nous avons developpe un outil de mise en correspondance semi-automatique des mots composes fonde sur les resultats d'une extraction de terminologie monolingue. Puis, nous avons propose des orientations pour l'automatisation de ce processus en trois etapes : appariement des chaines nominales et verbales internes a la phrase, appariement des mots composes internes aux chaines nominales et enfin, appariement des unitermes internes aux mots composes. Ces operations ne peuvent s'effectuer qu'a partir de phrases prealablement appariees. Cette approche a ete partiellement controlee sur de petits corpus mais necessite une evaluation a plus grande echelle.