thesis

Sur l'utilisation active de la diversité dans la construction d'ensembles classifieurs : application à la détection de fumées nocives sur site industriel

Defense date:

Jan. 1, 2009

Edit

Institution:

Valenciennes

Disciplines:

Authors:

Abstract EN:

Discussions about the influence of diversity when designing Multiple Classifier Systems is an active topic in Machine Learning. One possible way of considering the design of Multiple Classifier Systems is to select the ensemble members from a large pool of classifiers focusing on predefined criteria, which is known as the Overproduce and Choose paradigm. The objective of this PhD Thesis is to study the trade-off between accuracy and diversity which exists in multiple classifier systems. We review some well known Machine Learning algorithms and ensemble learning techniques from the literature and we present in details the concept of diversity and the way it is used by certain ensemble learning algorithms. We propose a genetic heuristic to design multiple classifier systems by controlling the trade-off between diversity and accuracy when selecting individual classifiers. We compare the proposed genetic selection with several heuristics described in the literature to build multiple classifier systems under the Overproduce and Choose paradigm. The application of our research work concerns the development of a supervised classification system to control atmospheric pollution around industrial complexes. This system is based on the analysis of visual scenes recorded by cameras and aims at detecting dangerous smoke trails rejected by steelworks or chemical factories.

Abstract FR:

L'influence de la diversité lors de la construction d'ensembles de classifieurs soulève de nombreuses discussions en Apprentissage Automatique. L’une des méthodes pour construire un ensemble de classifieurs, suit le paradigme « Surproduction et Sélection » et consiste à sélectionner certains membres d’un ensemble de classifieurs selon des critères prédéfinis. Les travaux présentés dans cette thèse ont pour objectif d'étudier le compromis entre la précision et la diversité qui caraCtérisent les ensembles de classifieurs. Nous présentons différents algorithmes d'apprentissage ainsi que les méthodes ensemblistes les plus fréquemment citées dans la littérature. Nous définissons ensuite le concept de diversité dans les ensembles de classifieurs ainsi que les différentes méthodes permettant de l'exploiter lors de la création de l'ensemble. Nous proposons un algorithme génétique que nous comparons avec différentes heuristiques de sélection de classifieurs proposées dans la littérature pour construire un ensemble selon le paradigme Surproduction et Sélection. Nous appliquons nos travaux de recherche au développement d'un système de classification supervisée pour le contrôle de la pollution atmosphérique sur des sites industriels. Ce système est basé sur l'analyse par traitement d'image concernant des situations à risque enregistrées à l'aide de caméras. Son principal objectif est de détecter des fumées nocives émises par des usines sidérurgiques ou pétrochimiques.