thesis

Extraction robuste de parametres prosodiques pour la reconnaissance de la parole

Defense date:

Jan. 1, 1995

Edit

Institution:

Paris 11

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

L'information prosodique, et particulierement la frequence fondamentale et la duree des sons, est importante pour developper des systemes de reconnaissance de la parole generaux et performants, mais est sous-utilisee a l'heure actuelle. Une raison a cela est le manque de robustesse des representations classiques de l'information prosodique. Nous proposons de nouveaux parametres prosodiques qui, tout en representant le meme type d'informations que les parametres classiques, sont calcules sans prise de decision intermediaire, ce qui les rend plus robustes face a la variabilite du signal de parole. De plus, ces parametres, ne dependant pas d'une segmentation a priori, peuvent etre integres directement dans le vecteur de parametres d'entree d'un systeme de reconnaissance. Ceci permet un traitement homogene et simultane des informations prosodiques et segmentales, et notamment d'appliquer des algorithmes statistiques de reconnaissance de la parole sans modification. Ces parametres ont ete developpes conjointement a un systeme complet d'etiquetage prosodique. Pour entrainer et tester le systeme, nous avons etiquete prosodiquement un corpus de parole spontanee comportant 1115 requetes, prononcees par 20 locuteurs. Le jeu de marqueurs est derive d'un systeme de description phonologique de l'intonation du francais. Les modeles appris sur ce corpus sont egalement evalues sur un autre corpus pour une tache de levee d'ambiguite. Ces nouvelles representations de l'information prosodique etendent la gamme de situations correctement traitees, permettent une meilleure integration de l'information prosodique en reconnaissance de la parole, et constituent des outils au service des recherches en phonetique et en linguistique