thesis

Connaissances et clustering collaboratif d’objets complexes multisources

Defense date:

Jan. 1, 2010

Edit

Institution:

Strasbourg

Disciplines:

Directors:

Abstract EN:

The new challenges brought by complex data require the development of new methods of data mining. In this thesis, we are particularly interested in the step of unsupervised classification (or clustering). The goal is to automatically create groups within a set of objects. There are many different clustering algorithms that can provide very different results even from the same data. A new method of collaborative clustering is presented, the latter leading to an improvement in the quality of collaboration between the methods. Furthermore, domain or contextual knowledge are often available on the clustering problem. In this thesis we study different methods for integrating knowledge into clustering algorithms. Finally, we propose an approach to integrate knowledge in collaborative clustering. Geoscienced and more particularly Earth observation through satellite images has been the main domain of application of our propositions. The approaches proposed in this thesis allowed us to create an automatic process for interpreting images guided by the knowledge of the expert.

Abstract FR:

Les nouveaux défis apportés par les données complexes imposent le développement de nouvelles méthodes de fouille de données. Dans cette thèse, nous nous intéressons plus particulièrement à l'étape du processus de fouille qu'est la classification non supervisée (clustering). Celle-ci consiste à créer, de manière automatique, des groupes au sein d'un ensemble d'objets. Il existe de nombreux algorithmes de clustering différents qui peuvent, à partir des mêmes données, fournir des résultats très différents. Une nouvelle méthode de clustering collaborative est présentée, celle-ci menant à une amélioration de la qualité de la collaboration entre les méthodes. De manière complémentaire, des connaissances du domaine ou contextuelles sont souvent disponibles sur le problème de clustering à considérer. Nous étudions dans cette thèse les différentes méthodes permettant d'intégrer des connaissances dans les algorithmes de clustering. Nous proposons enfin une approche d'intégration de connaissances dans le cadre du clustering collaboratif. Les géosciences et plus particulièrement l'observation de la Terre via les images de télédétection ont été le domaine privilégié d'application des propositions faites lors de cette thèse. Les approches proposées dans cette thèse ont permis de mettre en place un processus automatique d'interprétation d'image guidé par les connaissances de l'expert.