thesis

Auto-adaptation et reconnaissance automatique de la parole

Defense date:

Jan. 1, 2010

Edit

Institution:

Le Mans

Disciplines:

Directors:

Abstract EN:

The first part of this thesis presents a computer assisted transcription of speech method. Every time the user corrects a word in the automatic transcription, this correction is immediately taken into account to re-evaluate the transcription of the words following it. The latter is obtained from a reordering of the confusion networks hypothesis generated by the ASR. The use of the reordering method allows an absolute gain of 3. 4 points (19. 2% to 15. 8%) in term of word stroke ratio (WSR) on the ESTER 2 corpus. In order to decrease the proper nouns error rate, an acoustic-based phonetic transcription method is proposed in this manuscript. The use of SMT [Laurent 2009] associated with the proposed method allows a significant reduce in term of word error rate (WER) and in term of proper nouns error rate (PNER).

Abstract FR:

La première partie de cette thèse présente une méthode d’assistance à la transcription automatique de la parole. Le transcripteur humain dispose de la meilleure hypothèse fournie par le SRAP, et, à chaque correction de sa part, le système propose une nouvelle hypothèse prenant en compte cette correction. Cette dernière est obtenue à partir d’une réévaluation des réseaux de confusion générés par le SRAP. L’utilisation de la méthode de réordonnancement permet d’observer un gain absolu de 3,4% (19,2% à 15,8%) en terme de nombre de mots à corriger (WSR) sur le corpus ESTER 2. Afin de diminuer le taux d’erreur sur les noms propres, une méthode de phonétisation itérative utilisant les données acoustiques à disposition est proposée dans ce manuscrit. L’utilisation de SMT [Laurent 2009] couplée avec la méthode de phonétisation proposée permet d'observer des gains en terme de taux d'erreur mot (WER) et en terme de taux d'erreur noms propres (PNER).