Machines à vecteurs de supports pour une détection hiérarchique des visages
Institution:
Versailles-St Quentin en YvelinesDisciplines:
Directors:
Abstract EN:
Nous proposons dans cette thèse un algorithme efficace de détection des visages basé sur une hiérarchie de machines à vecteurs de support (SVM). Cette hiérarchie sert de plate-forme de echerche rapide des occurrences de visages. La plupart des sous-images d'une scène sont rejetées efficacement et seules les régions contenant des structures rares et semblables aux visages nécessitent un traitement plus intense. En allant de la racine vers les feuilles, les SVM correspondent à des domaines de pose de plus en plus restreints, et sont de plus en plus coûteuses et discriminantes. La complexité de chaque SVM dans la hiérarchie est définie par un modèle qui lie le taux d'erreur des SVM et leur coût d'évaluation. Cette complexité est réduite grâce à un clustering des vecteurs de support et par variation d'un biais afin de préserver les réponses positives de l'ensemble d'apprentissage et garantir ainsi ``l'hypothèse de conservation''. La stratégie de recherche est un parcours en profondeur avec élagage, qui permet ainsi un gain considérable en efficacité.
Abstract FR:
We describe a new face detection algorithm based on a hierarchy of support vector classifiers (SVMs) designed for efficient computation. The hierarchy serves as a platform for a coarse-to-fine search for faces: most of the image is quickly rejected as "background" and the processing naturally oncentrates on regions containing faces and face-like structures. The hierarchy is tree-structured: In proceeding from the root to the leaves, the SVMs gradually increase in complexity (measured by the number of support vectors) and discrimination (measured by the false alarm rate), but decrease in the level of invariance. Reduced complexity is achieved by clustering support vectors and shifting the decision boundary in order to satisfy a "conservation hypothesis" that preserves positive responses from the original set of training data. The computation is organized as a depth-first search strategy. The gain in efficiency is enormous.