Un cadre générique de découverte de motifs sous contraintes fondées sur des primitives
Institution:
CaenDisciplines:
Directors:
Abstract EN:
Pattern mining is a significant field of Knowledge Discovery in Databases. This thesis deals with the mining problem of local patterns under constraints. We propose a new framework relying on monotone primitives in order to define and mine varied constraints. This broad spectrum of constraints enables users to accurately focus on the most interesting patterns. We provide two main approaches for automatically mining patterns which solve the intrinsic algorithmic difficulty of this task. Their efficiency mainly relies on necessary conditions approximating the variation of contraints. Firstly, relaxing methods enable us to re-use numerous usual algorithms. Secondly, we design pattern mining algorithms dedicated to wide or correlated datasets by exploiting the concept of equivalence classes. Finally, the use of these methods highlights several relevant local phenomena in real industrial and medical applications.
Abstract FR:
La découverte de motifs est une tâche centrale pour l'extraction de connaissances dans les bases de données. Cette thèse traite de l'extraction de motifs locaux sous contraintes. Nous apportons un éclairage nouveau avec un cadre combinant des primitives monotones pour définir des contraintes quelconques. La variété de ces contraintes exprime avec précision l'archétype des motifs recherchés par l'utilisateur au sein d'une base de données. Nous proposons alors deux types d'approche d'extraction automatique et générique malgré les difficultés algorithmiques inhérentes à cette tâche. Leurs efficacités reposent principalement sur l'usage de conditions nécessaires pour approximer les variations de la contrainte. D'une part, des méthodes de relaxations permettent de ré-utiliser les nombreux algorithmes usuels du domaines. D'autre part, nous réalisons des méthodes d'extraction directes dédiées aux motifs ensemblistes pour les données larges ou corrélées en exploitant des classes d'équivalences. Enfin, l'utilisation de nos méthodes ont permi la découverte de phénomènes locaux lors d'applications industrielles et médicales.