Etude de la variabilité de l'indice de localisation pour la caractérisation de sources de parole interférentes
Institution:
Grenoble INPGDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
L'être humain possède de remarquables capacités à suivre une conversation lorsque plusieurs locuteurs sont présents simultanément (effet "cocktail party"). Dans le contexte d'Analyse de Scène Auditive (ASA), les psycho-acousticiens attribuent cette capacité à deux grands types de processus : ceux basés sur une analyse primitive des indices acoustiques (au niveau périphérique), et ceux basés sur les schémas (au niveau du central), faisant intervenir la mémoire. Parmi les indices primitifs, la localisation joue un rôle non négligeable dans la capacité à distinguer plusieurs sources simultanément. Dans ce cadre multidisciplinaire (traitement du signal, psycho-physiologie et reconnaissance de la parole), nous présentons une étude sur l'utilisation de l'indice de localisation (la différence interaural de temps), dans une tâche de ségrégation de sources de paroles. Dans un premier temps, nous utilisons le paradigme des doubles voyelles en expérimentation psychoacoustique et en modélisation afin de préciser le rôle de deux indices primitifs : le voisement et le délai interaural. Ensuite, nous étudions plus précisément le problème de l'estimation du décalage temporelle entre deux voies, pour des signaux de parole naturelle, en faisant varier des paramètres acoustiques et spatiaux (nombre de source, positions relatives sources/microphones), et des paramètres algorithmiques (pré-accentuation, durée de la fenêtre d'analyse, nombre de sous-bandes). Enfin nous étudions la possibilité d'utiliser l'indice de localisation pour le marquage du plan temps/fréquence, dans le cas de signaux de paroles concurrents. Pour cela, nous étidions la possibilité d'estimer le rapport de dominance entre les deux sources, en faisant varier la taille du pavé temps/fréquence.