Algorithmes de construction du Treillis de Galois pour des contextes généralisés
Institution:
Paris 9Disciplines:
Directors:
Abstract EN:
Our main concern in this thesis is concept (or Galois) lattices. As shown by previous works, concept lattices is an effective tool for data analysis and knowledge discovery, especially for classification, clustering, information retrieval, and more recently for association rules mining. Several algorithms were proposed to generate concepts or concept lattices on a data context. They focus on binary data arrays, called contexts. However, in practice we need to deal with contexts which are large and not necessarily binary. We propose a fast Galois lattice-building algorithm, called ELL algorithm, for generating closed itemsets from objects having general descriptions and we compare its performance with other existing algorithms. In order to have better performance et to treat bigger contexts we propose also a distributed version of ELL algorithm called SD-ELL.
Abstract FR:
Dans cette thèse, nous nous intéressons à la structure du treillis de concepts (ou treillis de Galois). Plusieurs travaux antérieurs ont montré l'intérêt des treillis de concepts à l'analyse de données, la classification supervisée ou non supervisée, à la recherche documentaire, et plus récemment à la recherche des règles d'association. Plusieurs algorithmes d'extraction de concepts à partir de contextes binaires ont été proposés. Cependant, dans la pratique les bases de données utilisées sont de grande taille et ne sont pas toujours binaires. Ainsi, nous proposons un algorithme rapide, appelé ELL, d'extractions de concepts à partir de bases de données généralisés. A fin d'obtenir de meilleures performances et de traiter des bases de données volumineuses, nous proposons également une version distribuée de l'algorithme ELL appelé SD-ELL.