thesis

Modélisation et suivi des déformations faciales : applications à la description des expressions du visage dans le contexte de la langue des signes

Defense date:

Jan. 1, 2007

Edit

Institution:

Toulouse 3

Disciplines:

Authors:

Directors:

Abstract EN:

The face, and particularly the meaning of its expressions, plays an important role in sign languages. A few studies on facial expressions in sign language exist. This is due to the lack of description tools. In this thesis, we develop methods that allow accurate and comprehensive description of the different facial movements observed during a sign language video. We use here the Active Appearance Model formalism (AAM) in order to model face, in terms of interest point displacements and texture variations. When used with an optimization method, this formalism allows to find interest point coordinates on a face. We use here an optimization method called « inverse compositional », that can be used to obtain accurate results in an efficient manner. In the sign language context, out-of-plane rotations and hand occlusions occur frequently. Thus, the development of robust methods is needed. It exists, for that purpose, a robust flavor of the AAM optimization methods that allow to consider the input image as being noisy. . .

Abstract FR:

Le visage joue un rôle prépondérant en langue des signes, notamment par le sens porté par ses expressions. Peu d'études existent sur les expressions faciales en langue des signes ; cela est dû au manque d'outil de description. Dans cette thèse, il s'agit de développer des méthodes permettant la description la plus précise et exhaustive possible des différents mouvements faciaux observables au cours d'une séquence vidéo de langue des signes. Le formalisme des modèles à apparence active (Active Appearance Models - AAM) est utilisé ici pour modéliser le visage en termes de déplacements d'un certain nombre de points d'intérêt et en termes de variations de texture. Quand il est associé à une méthode d'optimisation, ce formalisme permet de trouver les coordonnées des points d'intérêt sur un visage. Nous utilisons ici une méthode d'optimisation dite « à composition inverse », qui permet une implémentation efficace et l'obtention de résultats précis. Dans le contexte de la langue des signes, les rotations hors-plan et les occultations manuelles sont fréquentes. Il est donc nécessaire de développer des méthodes robustes à ces conditions. Il existe pour cela une variante robuste des méthodes d'optimisation d'AAM qui permet de considérer une image d'entrée éventuellement bruitée. . .