Knowledge Tree

thesis

Optimisation de l'allocation des ressources binaires et modelisation psychoacoustique pour le codage audio

Defense date:

Jan. 1, 1998

Edit

Institution:

Paris 5

Disciplines:

Computer sciences

Authors:

Marcos Perreau Guimaraes

Directors:

Madeleine Bonnet

Nicolas Moreau

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Ce travail de these rentre dans le cadre general du codage de source, plus precisement de la compression de sources sonores (parole et surtout musique). Pour obtenir des taux de compression significatifs (de l'ordre de 8 actuellement), il faut exploiter finement des phenomenes de masquage propres a l'oreille humaine. Tous les codeurs de musique (iso/mpeg-audio, dolby ac3, etc) exploitent des modeles d'oreille. Ce probleme a une grande importance, pratique d'abord, parce que la recherche de codeurs audio encore plus performants est toujours d'actualite (telephonie mobile, umts, radiodiffusion numerique, dvd, multimedia, etc). On rappelle que le codage de signaux de musique de facon transparente a 64 kbit/s reste un probleme ouvert. Cet objectif ne peut etre atteint qu'au prix d'une meilleure exploitation des proprietes de l'oreille pour mettre en forme spectralement le bruit de codage. Ce document de these decrit egalement la contribution a un autre projet initialement deconnecte du premier : la conception et le developpement d'un codeur (parole et musique de bande 20 hz-15 khz) hierarchique (32, 40, 48, 56, 64 kbit/s) a faible delai de reconstruction (trois fois plus petit que celui du codeur mpeg1-layer2) pour des applications du type teleconferences de haute qualite, telephonie sur hauts-parleurs. Ce codeur, developpe a l'enst, a une structure de codage originale combinant les avantages du codeur celp (structure de codage standard pour de la parole en bande telephonique) et du codage par transformee (demarche habituelle pour des codeurs de musique). Notre contribution a consiste a introduire un modele psychoacoustique adapte a ce codeur.