Maintenance de vues materialisees dans un environnement entrepot de donnees (data warehouse)
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Un entrepot de donnees (data warehouse en anglais) est une base de donnees interoperable permettant d'integrer des donnees a partir de bases de donnees individuelles heterogenes et geographiquement distribuees. Un entrepot de donnees est implemente sous forme de vues materialisees qui doivent etre mises a jour en fonction des changements apportes aux bases de donnees individuelles definissant l'entrepot de donnees. La maintenance de l'entrepot de donnees exige le choix d'une strategie de mise a jour. Trois strategies de base sont proposees, a savoir une strategie immediate, differee ou periodique. La premiere strategie propose de mettre a jour les vues de l'entrepot de donnees en debut de chaque transaction globale. La deuxieme differe les changements a propager sur les vues jusqu'a la reception de requetes utilisateur sur ces vues. Ainsi, une vue est mise a jour uniquement lorsqu'elle va etre interrogee. La troisieme strategie rafraichie les vues de l'entrepot de donnees periodiquement a differents intervalles. Quelque soit la strategie adoptee, la maintenance peut simplement recalculer le contenu de l'entrepot de donnees. Cette approche est completement inefficace. La maintenance d'un entrepot de donnees est efficace lorsque les changements (ensembles d'insertions, suppressions, ou mises a jour) effectues aux bases de donnees individuelles peuvent etre propages a l'entrepot de donnees par augmentation (ou de maniere differentielle), c'est a dire en repercutant ces modifications sur les vues materialisees sans etre obliger de recalculer completement leurs contenu. Cette efficacite est amelioree lorsque de multiples strategies de mise a jour sont adoptees. Dans cette these nous proposons un mecanisme a base de regles de production permettant d'assurer la maintenance de vues odmg materialisees dans un environnement entrepot de donnees. Ce mecanisme permet de detecter les changements apportes aux bases de donnees individuelles, de les filtrer, de les raffiner en eliminant les suppressions pertinentes sans effet et de propager ces changements sur les vues tout en considerant que chaque objet admet de multiples derivations. Ce mecanisme permet egalement aux systemes gerant un entrepot de donnees d'adopter de multiples strategies de mise a jour.