Extension de la régression classique à des problèmes typologiques et présentation de la "méthode des tranches de densité" : une approche basée sur la percolation
Institution:
Aix-Marseille 3Disciplines:
Directors:
Abstract EN:
We are about to tackle hereafter the problem of generalizing the regression concept for the purpose of taking into account the data's structural aspects. The resolutions of this matter of fact are mostly overlooked although taking them into consideration would allow a better understanding of a great number of phenomenons and would lead to the establishment of more adequate models. In addition ot the outliers, some other fundamental factors may undermine as well the quality of the models. These factors are structural in nature. Therefore our objctive is to show that from the same set of data, it is possible to search automatically one or even several resulting models. We propose, within this thesis, a method of resoulution that should be both simple and efficient: "the method of density slices", which aim is to find underlying "multimodels" when one is handling heterogeneous data. This method treis to synthesize regression and classification techniques. The non-hierarchical classification of data must be guided by the "percolation principle" and has to be realized simultaneously with the computation of the regression hyperplans. The percolation principle which aims to find the strong density points, has to be applied to slices of points and no longer to individual points. The basis of this method are discussed herewith, an algorithm and some results are presented as well.
Abstract FR:
Le probleme que nous abordons tel est celui de la generalisation du concept de la regression ayant pour but la prise en compte des aspects structurels de l'ensemble des donnees. Cet aspect des choses est pratiquement toujours passe sous silence au niveau des resolutions, alors que sa prise en compte devrait permettre un comprehension beaucoup plus precise d'un tres grand nombre de phenomenes et la mise en place de modeles plus adequats sur nombres de realites. Independamment de la prise en compte des points aberrants, d'autres raisons, fondamentales aussi, peuvent etre la cause d'une mauvaise qualite des modeles. Ces raisons sont d'ordre structurel et c'est ce a qoui nous nous interessons ici, en montrant qu'il est possible sur un meme ensemble de donnees de rechercher automatiquement l'existence d'un modele ou de plusieurs modeles sous-jacents. Nous proposons dans cette these, une methode de resolution simple et efficace: "la methode des tranches de densite" dont le but est la mise en evidence de "multimodeles" internes a une realite ou l'hypothese d'homogeneite des donnees ne peut etre acceptee. Cette methode tente de faire une synthese des techniques de regression et de typologie. La classification non-hierarchique des donnees est effecutee selon le principe de la percolation et est realisee simultanement avec le calcul des hyperplans de regression. La recherche des points de forte densite selon le principe de la percolation est appliquee non plus sur les points mais sur les tranches de points. Les fondements de la methode sont discutes, et, un algorithme et quelques resultats presentes.