Classification et discrimination des donnees qualitatives : discrimination multinomiale regularisee
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these regroupe plusieurs contributions a la classification et a la discrimination de donnees binaires ou qualitatives. En classification, nous resolvons, d'un point de vue geometrique, le probleme de la construction de ponderations optimales des variables simultanement a la construction d'une partition. Nous comparons ensuite notre approche a l'approche probabiliste. Le reste de ce travail est consacre a la discrimination sur variables binaires et qualitatives. Nous nous sommes restreints a des echantillons de petite taille. Le but est d'analyser les performances des methodes classiques et d'en proposer de nouvelles. Apres une revue bibliographique appuyee d'exemples d'application, nous presentons une etude de discrimination sur des donnees reelles qui nous a permis de proposer une strategie de reduction de la dimension du probleme fondee sur une technique de classification des variables resumant au mieux l'information discriminante. On etudie ensuite l'estimation des parametres de lissage pour l'estimation non parametrique de densites. Nous developpons des expressions explicites du parametre de lissage contrairement aux procedures classiques. Ces estimateurs sont fondes sur des approximations utilisant la validation croisee et le bootstrap. Enfin, on propose une nouvelle methode de discrimination, la discrimination multinomiale regularisee, particulierement adaptee a des echantillons de petite taille. Elle utilise deux parametres de regularisation, determines de maniere optimale, pour definir une regle de decision fiable. Le premier parametre permet d'obtenir une regle de decision intermediaire entre le modele multinomial complet et le modele d'independance d'ordre un. Le deuxieme parametre est un parametre de lissage. Les experimentations, que nous presentons ensuite, montrent les qualites de cette methode