thesis

Biologically inspired algortithms for exploratory projection pursuit

Defense date:

Jan. 1, 2011

Edit

Institution:

Toulouse 1

Disciplines:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

La thèse consiste à utiliser des méthodes bio-inspirées pour détecter d’éventuelles structures d’intérêt cachées dans des données volumineuses et multidimensionnelles. L’exploration des données et la détection des structures intéressantes sont basées sur l’utilisation de projections révélatrices qui consistent à optimiser des fonctions appelées indices de projection. Les solutions associées à des optimas sont supposées conduire à des représentations graphiques intéressantes dans des espaces de faibles dimensions. Les structures de données sont complexes et les indices de projection ne possèdent pas nécessairement des propriétés de régularité ce qui rend le problème d’optimisation complexe et coûteux en temps de calcul. Parmi les techniques bio-inspirées, les algorithmes génétiques (AG), l’optimisation par essaim particulaire (l’OEP) et une méthode hybride d’OEP dite Tribes ont été choisies. Trois indices issus de la littérature ont été choisis et un autre indice a été proposé. Ces indices sont optimisés dans le cas unidimensionnel et les structures recherchées sont essentiellement des groupes et/ou atypiques. Ces quatre indices de projection et trois méthodes d’optimisation ont été mis en œuvre dans un logiciel appelé EPP-Lab. Ce logiciel est facile à utiliser avec une manière différente d’analyser les résultats obtenus. La recherche de plusieurs optima locaux a été faite par le biais de lancements successifs indépendants. Une autre stratégie consiste à proposer une méthode multimodale inspirée de Tribes qui permet d’obtenir en un seul lancement plusieurs optima. Enfin, la dernière partie consiste à rechercher des groupes en tenant compte de la position géographique des observations statistiques. Une seconde fonction objectif a été proposée pour minimiser la distance entre les observations statistiques appartenant au même groupe. Trois algorithmes multiobjectifs bio-inspirés ont été choisis. Quelques exemples de données réels et simulés ont été traités pour valider la performance de chaque algorithme dans le contexte des projections révélatrices.