Eléments pour un système de reconnaissance automatique de la parole continue du français
Institution:
AvignonDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these porte sur la reconnaissance automatique de la parole (rap). Dans une premiere partie, nous definissons les bases theoriques de la rap. Nous insistons notamment sur les methodes probabilistes utilisees dans ce travail de recherche et sur les raisons qui poussent a mettre en uvre des strategies dites multi-passes. Nous terminons par un tour d'horizon de systemes de reconnaissance automatique de la parole continue (srapc) afin de faire le point sur les differentes strategies employees actuellement. La seconde partie est consacree a la realisation d'un systeme de decodage acoustico-phonetique (dap) fonde sur la modelisation markovienne. D'une maniere generale, la problematique traitee recouvre l'ensemble des problemes rencontres lors de l'automatisation des processus de construction d'un moteur de rap. En ce qui concerne le dap, nous etudions particulierement la phonetisation et l'impact de l'alignement des donnees acoustiques et phonetiques sur l'initialisation des modeles acoustiques. Dans la troisieme partie, nous etudions l'acces lexical et la modelisation du langage. Tout d'abord, nous presentons un srapc de reference. Puis, nous proposons deux strategies de reconnaissance alternatives. La premiere est une strategie multi-passes fondee sur une simplification du lexique et un processus de filtrage acoustico-linguistique. La seconde strategie proposee vise a inclure des ressources linguistiques directement dans un processus de decodage derive de l'algorithme a*. Enfin, dans la quatrieme et derniere partie, nous nous interessons a la fabrication de modeles de langage (ml) probabilistes. Nous proposons une methode qui permet de faciliter la mise au point de ml grace a un processus d'extraction de sous-modeles de langage (sml) a partir d'un ml calcule au prealable