Une contribution à l'organisation des données multidimensionnelles
Institution:
Cergy-PontoiseDisciplines:
Directors:
Abstract EN:
In the context of multidimensionnal data, OLAP (On-Line Analysis Processing) tools are used to explore the data cube, aiming at discovering pertinent and abstract knowledge. This thesis introduces new approaches to enhance multidimensionnal data analysis. The approach in organizin the data is based on the measure values, and not on the associated member valuse. We define a representation of a data cube as the way the measures values are organized. We propose to appropriate the representation and to achieve the goal of computing the appropriate representations. We establish a framework to determine the quality of the cube representations. Two commons search techniques, hill climbing search and genetic algorithm, are used to perform the search for appropriate representations. We extend our work by introducing a novel approach in building blocks of similar measure values and we associate each block with a rule. Our method is based on a levelwise algorithm (a la Aprori) as well as fuzzy set theory, so as to take into account the fact that blocks may overlap.
Abstract FR:
Dans le contexte des données multidimensionnelles les outils OLAP (On-Line Analysis Processing) sont utilisés pour explorer les cubes de données, pour découvrir des connaissances pertinentes et résumées. Dans cette thèse, nous présentons de nouvelles approches afin d’étendre l’analyse de données multi dimensionnelles. Notre approche est fondée sur les valeurs de mesure contenues dans le cube, et non sur les valeurs des membres associées. Nous définissons la notion de représentation d’un cube de données comme étant la manière dont les valeurs de mesure sont organisées. Nous proposons de calculer des représentations dites appropriées, et nous définissons la notion de qualité de telles représentations. Deux méthodes de recherche, hill climbing et algorithme génétique, sont utilisées pour calculer les représentations appropriées. Nous étendons notre travail par une méthode de calcul de blocs de valeurs de mesure similaires, permettant d’associer une règle à chaque bloc. Notre méthode, utilise un algorithme par niveaux et la théorie des ensembles flous.