thesis

Authentification vocale par téléphone en mode dépendant du texte

Defense date:

Jan. 1, 1997

Edit

Institution:

Paris, ENST

Disciplines:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Dans cette thèse, on étudie comment la connaissance du texte prononce par le locuteur peut être exploitée en authentification vocale. Les systèmes de vérification proposes ne sont fondamentalement que des systèmes de reconnaissance de parole mono locuteur (hmm ou dtw), dans lesquels on modifie l'étage de décision en considérant en plus du score du modèle monolocuteur un score rendant compte de la qualité intrinsèque de la parole prononcée. Plusieurs façons d'estimer et d'intégrer dans la décision un score autre que celui du locuteur prétendu sont étudiées et un modèle de normalisation qui permet au locuteur de choisir librement son mot de passe avec des performances acceptables est proposé. La connaissance du texte prononce par le locuteur est également utilisée dans le calcul de la mesure de similarité entre le test et la référence. On propose d'interpréter les systèmes de vérification hmm ou dtw comme des classificateurs en deux étapes distinctes, la première étant l'alignement qui doit assurer la mise en correspondance d'évènements acoustiques de test et de référence selon un critère de reconnaissance de parole, la deuxième étape étant le calcul du score de vérification, qui doit mesurer ce qui, pour un évènement acoustique donne, fait la spécificité du locuteur. Un formalisme pour l'optimisation du calcul du score de vérification est proposé. Il concerne l'espace acoustique utilise pour représenter le locuteur : on recherche parmi un ensemble de paramètres acoustiques potentiels le jeu optimal selon un critère de minimisation du taux d'erreur. Ce formalisme est applique à l'étude d'espaces acoustiques parmi les plus fréquemment utilises et permet d'identifier des jeux de taille restreinte et beaucoup plus robustes a peu de données d'apprentissage que les jeux de paramètres classiquement utilises pour représenter le locuteur. Enfin, des expériences sur une base de données publique valident les approches proposées et concluent ce travail.