thesis

Sélection de modèles pour la classification supervisée avec des SVM (Séparateurs à Vaste Marge) : application en traitement et analyse d'images

Defense date:

Jan. 1, 2006

Edit

Institution:

Caen

Disciplines:

Authors:

Directors:

Abstract EN:

This thesis mainly deals with the importance of model selection to design efficient supervised machine learning schemes based on SVM classifiers. Three issues relating to the definition of such machine learning schemes have been investigated. The first issue concerns the evaluation of the generalization abilities of a classifier by cross validation techniques. We show that it is possible to take into account the inherent correlations between SVM training phases in order to significantly reduce the computation costs. The second issue concerns complexity reduction of SVM classifiers. Two approaches are proposed: 1) The design of a methodology to select a subset of relevant examples for producing low complexity SVM decision functions while increasing their generalization abilities; 2) The definition of a given metaheuristic based on Tabu search to optimise a trade-off between generalization abilities and complexities of SVM decision functions. The third issue concerns the development of efficient combination schemes of SVM classifiers using evolutionary algorithms for multi-model optimisation. We show that the higher the number of classes is, the greater the influence of the choices of decomposition, decoding and optimisation is. Proposed methods are used to define efficient SVM decision processes for two kinds of applications dedicated to image processing.

Abstract FR:

Cette thèse porte sur l’importance de la sélection de modèles pour la constitution de systèmes d’apprentissage supervisé à base de SVM performants. Nous abordons trois problématiques liées à la définition de tels systèmes. La première problématique concerne l’évaluation des capacités de généralisation d’un modèle à partir de techniques de validation croisée. Nous montrons qu’il est possible de prendre en compte les corrélations existantes entre les nombreuses phases d’entraînements des SVM induites par ces techniques afin de réduire significativement leurs coûts calculatoires. La deuxième problématique concerne la réduction de la complexité des processus décisionnels. Deux approches sont proposées : 1) le développement d’une méthodologie pour réaliser la sélection d’un sous-ensemble d’exemples pertinents à partir d’une base d’apprentissage afin de produire des fonctions de décision de complexités réduites tout en augmentant leurs capacités de généralisation ; 2) la définition d’une méthode méta-heuristique basée sur une recherche avec tabous pour réaliser l’optimisation d’un compromis entre capacité de généralisation et complexité d’un processus décisionnel. La troisième problématique concerne l’élaboration de schémas multi-classes performants par combinaison de classificateurs binaires et leur optimisation multi-modèle à partir d’algorithmes évolutionnaires. Nous montrons que ces considérations sont d’autant plus importantes que le problème comporte un grand nombre de classes. Deux applications illustrent que les méthodes proposées dans cette thèse permettent de produire des processus décisionnels performants dans le cadre du traitement et de l’analyse d’images.