thesis

Classification supervisée et semi-supervisée : contributions à la classification d’images et de documents

Defense date:

Jan. 1, 2005

Edit

Institution:

Rouen

Disciplines:

Directors:

Abstract EN:

This manuscript proposes some contributions to the supervised and semi-supervised document image classification under contraints such as a low number of training samples, dynamic feature selection and classification time. The first chapter draws up a general introduction of problems by exposing the components of a document image processing system. The second chapter proposes a strategy for the supervised classification based on the concepts from point of view in several feature spaces and induced distance space. The third chapter proposes a method for the semi-supervised classification based on a collaboration between the dendogrammes obtained by ascending hierarchical clustering using several feature spaces. Lastly, the last chapter draws up a conclusion and opens on prospects for the continuation for this work.

Abstract FR:

Cette thèse propose des contributions à la problématiques de la classification supervisée et semi-supervisée des images de documents sous des contraintes telles qu’un faible nombre d’exemples d’apprentissage, la sélection dynamique de caractéristiques pertinentes et le temps de classification. Le premier chapitre dresse une introduction générale de la problématique en exposant les composants d’une chaîne de traitement des images de document. Le second chapitre propose une stratégie de classification supervisée basée sur les notions de point de vue dans plusieurs espaces caractéristiques et d’espace de distances induit. Le troisième chapitre propose une méthode de classification semi-supervisée se basant sur une collaboration entre les dendogrammes obtenus par classification ascendante hiérarchique à partir de plusieurs espaces de caractéristiques. Enfin, le dernier chapitre dresse une conclusion et ouvre des perspectives pour la poursuite de ce travail.