Classification hybride distribuee par collaboration de methodes non supervisees
Institution:
Université Louis Pasteur (Strasbourg) (1971-2008)Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
La classification est une technique qui permet d'extraire de maniere automatique des connaissances a partir d'un ensemble de donnees. Pour cela, de nombreuses methodes ont ete developpees et ont montre leur pertinence dans de nombreux domaines. Cependant chacune de ces methodes presentent des limites ou des inconvenients. De plus, pour un meme jeu de donnees, ces methodes donnent des resultats sensiblement differents et surtout de types differents (hierarchie de concepts, partitionnement). De ce fait, deux problemes se posent lorsque l'on desire effectuer une classification. Quelle methode de classification choisir ? quels parametres choisir pour cette methode ? les reponses a ces questions sont souvent liees au domaine d'application et/ou a des connaissances a priori d'une part sur celui-ci et d'autre part sur les donnees a classer. C'est pourquoi nous proposons une nouvelle approche qui consiste a integrer differents types de methode de classification non supervisee et a les faire collaborer par un processus de raffinement automatique et mutuel de leurs resultats. Ceci permet d'utiliser des mecanismes d'unification (methode de vote, reclassification, etc. ) et d'en augmenter leur efficacite. Nous pouvons alors proposer un resultat unique representant l'ensemble de ces resultats, ce qui est tres difficile, voire impossible a partir des classifications initiales. Ainsi nous pallions certaines limites des methodes utilisees et nous limitons l'importance des choix initiaux. De plus, plusieurs occurrences d'une meme methode peuvent etre utilisees simultanement. Ainsi, l'influence des parametres initiaux est attenuee. Un premier prototype a ete implante a partir de cette methode et a donne des resultats tres satisfaisants, sur des donnees de differentes origines. Notamment de bons resultats ont ete obtenus dans le domaine de la classification d'images de teledetection, qui est un probleme tres difficile.