thesis

Choix d'un classifieur en discrimination

Defense date:

Jan. 1, 1994

Edit

Institution:

Paris 9

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Dans cette thèse, nous nous posons le problème de la détermination du classifieur le plus adapté à résoudre un problème donné de discrimination. Le choix du classifieur est déjà guidé par des contraintes opérationnelles, mais au-delà de ces contraintes, et après que le classifieur a été configuré grâce à une base d'apprentissage, c'est le taux de généralisation du classifieur (ou taux de réussite) qui est le critère caractérisant sa performance. Ce taux, généralement inconnu, est estimé à l'aide d'une base de généralisation. Cette estimation dépend donc du problème de discrimination étudié, du classifieur utilisé, de la base d'apprentissage et de la base de généralisation. Ces différentes dépendances sont étudiées soit théoriquement, soit de manière expérimentale, sur une douzaine de classifieurs différents, neuronaux et classiques. Le problème de la validité de la comparaison de deux classifieurs par les estimations de leur taux de généralisation est aussi étudié, et nous obtenons des informations sur les tailles relatives à donner aux bases d'apprentissage et de généralisation. Dans un objectif de comparaison de classifieurs, Neuroclasse, un outil logiciel donnant la possibilité de tester un grand nombre de classifieurs différents, a été développé, et est précisément décrit. Dans Neuroclasse est aussi intégré un système pour la détermination automatique du classifieur fournissant le meilleur taux de généralisation estimé sur une base de généralisation fixée. Ce système est implanté sous forme d'un système expert. Ce système, testé sur différentes bases de données, donne de bons résultats, mais met en évidence un phénomène d'apprentissage de la base de généralisation, dû aux tests successifs de nombreux classifieurs sur une même base de généralisation. Nous étudions ce phénomène expérimentalement, et nous donnons un ordre de grandeur du nombre de classifieurs qu'il est possible de tester en limitant cet effet