Amélioration de la parole et détection d'activité vocale dans les systèmes de télécommunications mobiles
Institution:
ValenciennesDisciplines:
Directors:
Abstract EN:
Many works have already been published on noise or echo cancellation, but they mainly concentrate on environments very different from the inside of vehicles. In a vehicle, the word enhancement process is also concerned by the interferences among interlocutors. This work analyzes methodically the techniques of spectral subtraction to deduce their performances on compensation of several typical damages present in the environment of vehicles. This leads to the suggestion of an effective system model for increasing word audibility. A new structure based on an algorithm for word / noise classification, relying on higher (than second) order statistics (HOS), an evolution of the extended spectral subtraction technique, ESS, and an adaptive identification system, AIS, is derived. It gives estimates from two simultaneous observations. The performances of this system in the classic noise reduction and echo suppression problems are investigated. This system includes a digital processing part for word enhancement and a communication part. It should be capable of localizing an identified (target) speaker, to cancel the echoes produced inside the vehicle, to fight against several various noise sources, and to block all other signals, which could as well influence any post-processing of the words, like compression, transmission, or reception.
Abstract FR:
Les développements récents du traitement du signal vocal dans le domaine des télécommunications sont liés aux progrès rapides des technologies de traitement numérique du signal et à l'apparition de la fonction '' mains libres ''. L'apparition de nouveaux services multimédias associant la parole, les images et les données sera encore le moteur principal du développement des recherches en traitement du signal de parole. Les travaux effectués dans ce mémoire visent à améliorer la qualité de reconstitution de la parole et de réduire au maximum les bruits perturbateurs associés au signal de parole transmis. Une nouvelle structure d'amélioration de la parole et de détection d'activité vocale (DAV) pour les systèmes de télécommunications mobiles est présentée. Cette méthode est fondée sur une prise de son à deux microphones. Elle exploite un algorithme de classification Parole / Bruit basé sur les statistiques d'ordre supérieur (SOS), suivi par une technique dite de soustraction spectrale étendue (SSE) et un système d'identification adaptatif (SIA). Cette structure permet effectivement un débruitage efficace du signal de parole, même dans un environnement difficile comme celui de l'habitacle des véhicules automobiles. L'efficacité atteinte avec notre système est supérieure à celle des techniques classiques auxquelles nous l'avons comparé.