thesis

Adaptation des modeles acoustiques pour la reconnaissance de la parole bruitee

Defense date:

Jan. 1, 1997

Edit

Institution:

Paris 11

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Cette these se situe dans le cadre de la reconnaissance de la parole bruitee par des modeles statistiques (modeles de markov caches a distributions continues : mmcdc). Le meilleur systeme de reconnaissance pour des conditions particulieres d'utilisation est celui qui est appris dans ces memes conditions. L'objectif principal de ce travail est d'approcher au mieux cette configuration. Pour cela nous proposons une nouvelle approche d'adaptation qui consiste en une compensation explicite des bruits (additif et convolutif). Elle est fondee sur le modele du canal de transmission : y = (s + n)*h, ou y, s, n et h designent respectivement le signal observe, le signal propre correspondant, le bruit additif ambiant et le bruit convolutif. Cette technique permet avec peu d'approximations d'adapter les parametres statistiques statiques et dynamiques du systeme. L'hypothese que les donnees d'apprentissage sont propres est rarement verifiee dans la pratique. Nous proposons une technique plus generale que la premiere pour compenser conjointement les bruits additifs et convolutifs de test et d'apprentissage. Dans certaines applications on s'interesse a la qualite du signal acoustique et non pas au message linguistique qu'il porte. Nous proposons une technique de debruitage fondee sur la modelisation du signal propre par des mmc autoregressifs (mmcar) et du bruit par une gaussienne ar. Le processus d'estimation des filtres est iteratif et necessite une bonne initialisation pour converger vers la bonne solution. Pour cela nous proposons une nouvelle strategie combinant l'utilisation des mmc fondes sur le cepstre, l'utilisation des mmcar et la technique d'adaptation developpee dans cette these. Cette technique de debruitage donne des resultats tres satisfaisants du point de vue perceptif (augmentation significative du rapport signal sur bruit avec tres peu de distorsions).