thesis

Extension et optimisation pour la segmentation de la distance de Kolmogorov-Smirnov

Defense date:

Jan. 1, 1998

Edit

Institution:

Paris 9

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

La segmentation est une méthode qui entre dans le cadre de l'analyse des données multidimensionnelles ; elle se distingue des autres méthodes lorsqu'on passe à la phase descriptive des résultats, telle que la lisibilité des règles de décision. La segmentation peut être vue, d'une part, comme une méthode exploratoire et descriptive permettant de résumer et structurer, sous la forme d'un arbre binaire, un ensemble d'observations multidimensionnelles. D'autre part, comme un outil décisionnel et inférentiel visant à produire une règle de classement sur les objets appartenant à une partition connue a priori. Dans la phase décisionnelle, la segmentation emploie un ensemble d'outils statistiques et probabilistes (la théorie bayésienne, les techniques d'échantillonnage, l'estimation de paramètres). En pratique, plusieurs travaux sur la segmentation ont conduit récemment à développer des algorithmes d'aspects exploratoire et décisionnel, souvent fiables et efficaces ; quant aux règles de production elles sont aisément interprétables par des non-spécialistes de la statistique. On rencontre de nombreuses applications réalisées dans divers domaines tels que la médecine, la biologie ou la reconnaissance des formes. Dans cette thèse, on s'intéresse au critère de Kolmogorov-Smirnov, qui fait partie des outils de la segmentation sur les variables quantitatives. Plusieurs simulations ont conclu positivement, tant sur son pouvoir de discrimination assez puissant que sur sa robustesse et son efficacité asymptotique au sens de Bayes. La première phase de ce travail est consacrée à l'extension de ce critère aux variables qualitatives et aux propriétés asymptotiques. La deuxième phase porte sur la réduction de la complexité exponentielle pour la recherche d'une solution globalement optimale à une complexité polynomiale de degrés trois. La phase finale s'intéresse à la programmation de ce critère et à son intégration dans le logiciel Sicla.