thesis

Traduction automatique de la parole par méthodes statistiques

Defense date:

Jan. 1, 2007

Edit

Institution:

Paris 11

Disciplines:

Abstract EN:

The subject of this thesis is automatic speech translation. The task is the translation of the European Parliamentary Plenary Sessions proceedings, between English and Spanish. Two statistical translation systems are used. The first one has been entirely developed during this thesis and relies on the IBM-4 model. The second system employs Moses, an open-source, state-of-the-art phrase-based translation decoder. A collaboration between the two decoders is envisaged. The neural-network language model proves extremely useful in both translation directions. The systems described in this thesis obtained top rankings at the last TC-Star evaluation of February 2007. An algorithm inspired from the Perceptron is proposed to modify the phrase-table scores in a discriminative manner, based on errors observed on a development corpus. With respect to the interaction between speech recognition and translation, we measure the impact of the speech recognition word error rate on translation performances, and evaluate separately the respective impact of the source language model and the acoustic model. We also run experiments to take into account the ambiguity of the speech recognition output, i. E. The words between which the speech recognizer "hesitates". We then present several speech-specific processings, occurring after the recognition and before the translation. Eventually, we modify the speech recognition system so as to improve the overall speech translation performance.

Abstract FR:

Cette thèse porte sur la traduction de la parole reconnue automatiquement. La tâche retenue est la traduction des discours des députés européens aux sessions plénières du parlement européen, entre l'anglais et l'espagnol. Cette thèse repose sur deux systèmes de traduction statistique. Le premier a été entièrement développé au cours de cette thèse et met en œuvre le modèle IBM-4. Le second système emploie Moses, un décodeur libre par groupes de mots à l'état de l'art. Nous envisageons aussi une collaboration entre les deux décodeurs. Le modèle quadrigramme neuronal s'avère très performant dans les deux sens de traduction. Les systèmes de traduction mis en oeuvre dans cette thèse furent très compétitifs à l'évaluation TC-Star de février 2007. Nous proposons un algorithme inspiré de celui du Perceptron pour modifier de façon discriminante les scores de la table de traduction en observant les erreurs de traduction sur un ensemble de développement. Concernant l'interaction entre reconnaissance de la parole et traduction, nous mesurerons l'impact du taux de mots erronés de la reconnaissance sur les performances de la traduction, et évaluons séparément les impacts respectifs du modèle de langage source et du modèle acoustique. Nous menons également des expériences prenant en compte l'ambiguïté de la sortie de la reconnaissance automatique, c'est-à-dire les mots entre lesquels la reconnaissance « hésite ». Nous décrivons ensuite plusieurs traitements spécifiques à la parole qui interviennent après la reconnaissance et avant la traduction. Enfin, nous modifions le système de reconnaissance de manière à améliorer les performances de traduction de la parole.