thesis

Sélection et fusion de signatures visuelles parcimonieuses : application à la classification d'images naturelles

Defense date:

Jan. 1, 2007

Edit

Institution:

Bordeaux 2

Disciplines:

Abstract EN:

This thesis is concerned with automatic classification. The objective is to assign an identity to a test image among a set of known category. The underlying approach aim at extracting a specific set of parsimonious visual signatures, then selecting and melting discriminative information, before designing a classification scheme adapted to the context. Many methods have been proposed in order to describe visual content. One of the most effective is based on points of interest extraction and local singularity description. In the thesis, this principle is used to define next local signature and combination, based on self-organizing neural maps. A novel image information support s then proposed, being the activation of a multimodal neural model. The proposed methods focus on specific elements of one image class versus the other categories. It permits robustness to viewpoint changes, illumination variations and partial occlusions. The proposed techniques are evaluated and compared to usual methods using various international databases. These experiments show the effectiveness of the proposed approaches, in particular, in the domains of image classification, face recognition and objectionable content exclusion.

Abstract FR:

Les travaux effectués dans le cadre de cette thèse portent sur la classification automatique des images numériques en fonction de leur contenu visuel. L'objectif est d'assigner à une image de test une identité parmi celles d'un ensemble de catégories connues. Pour cela, on cherche à extraire un ensemble de signatures visuelles parcimonieuses, qui lui soit spécifique, puis à sélectionner et structurer l'information discriminante, avant de proposer une classification adaptée à leur nature et à l'application visée. De nombreuses méthodes ont été proposées dans la littérature pour décrire le contenu visuel des images. Parmi les plus efficaces, on compte les techniques d'extraction de points d'intérêt et de descriptions des singularités locales. Ce travail reprend ce principe et propose de nouvelles techniques de sélection et de fusion de signatures locales, basées sur l'analyse de cartes de neurones auto-organisatrices. Un nouveau support de l'information du contenu visuel est alors proposé comme étant l'activation d'un modèle neuronal multimodal. Les méthodes proposées permettent de se focaliser sur les éléments spécifiques d'une catégorie, vis-à-vis des autres catégories en compétition. Elles permettent ainsi une certaine robustesse aux changements de prises de vue, aux variations d'illumination et aux occultations partielles. Les techniques proposées sont évaluées et comparées aux approches usuelles selon des protocoles expérimentaux rigoureux. Les résultats ainsi obtenus montrent les très bonnes performances des approches introduites dans les domaines de la classification d'images, de la reconnaissance de visages et du filtrage de contenus tendancieux.