Approches théoriques de l'estimation de niveaux de densité : application à la détection d'anomalies
Institution:
Paris 11Disciplines:
Directors:
Abstract EN:
Density level sets (d. L. S. ) are objects of particular interest in the general context of discriminant analysis: they are used to define optimal tests to discriminate one class from the others. The present thesis work, which belongs to the statistical learning theory framework, investigates different procedures to estimate d. L. S. From a data sample. It mainly consists of 4 contributions: the first two ones provide a theoretical analysis of the statistical behaviour of plug-in methods on the one hand, and of 1-class Support Vector Machine (SVM) on the other hand. They give consistency results and performance bounds associated with these methods. The third contribution introduces a new algorithm for pattern recognition, namely the Kernel Projection Machine (KPM), and it shows how to turn such an algorithm into a procedure for d. L. S. Estimation. It also shows how to derive associated performance bounds. Finally, a real-world application of d. L. S. Estimation is presented. It is concerned with monitoring testers involved in quality control procedures in the semiconductors industry.
Abstract FR:
Les ensembles de niveaux de densité (e. N. D. ) sont des objets particulièrement intéressants dans le contexte général de l'analyse discriminante : ils correspondent aux régions optimales servant à discriminer une classe des autres. Cette thèse, qui s'inscrit dans le cadre de la théorie de l'apprentissage statistique, s'intéresse aux différentes procédures pour estimer les e. N. D. A partir de données échantillonnées. Elle se compose essentiellement de 4 contributions : les deux premières contributions fournissent des analyses théoriques du comportement statistique associe, d'une part, aux méthodes de type plug-in, et, d'autre part, à la 1-class Support Vector Machine (SVM). Elles donnent des résultats de consistance pour ces méthodes, ainsi que des bornes de risque. La troisième contribution introduit un nouvel algorithme, la Kernel Projection Machine (KPM), pour la classification. Elle montre également comment il est possible d'utiliser un tel algorithme pour l'estimation d'e. N. D. , et comment dériver des bornes de risques associées. Enfin, la dernière contribution présente une application de l'estimation d'e. N. D. A un problème industriel, lie au contrôle de qualité dans le domaine de la fabrication des semi-conducteurs.