Data mining : algorithmes pour l'analyse de schemas de bases de donnees relationnelles
Institution:
Clermont-Ferrand 2Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
De nos jours, la technologie des bases de donnees relationnelles est tres repandue et se retrouve dans pratiquement tous les domaines d'application. Dans ce contexte, reduire les fonctions d'administration des bases de donnees est reconnu comme un nouveau challenge pour la communaute bases de donnees. L'administration logique (i. E. Du schema) d'une base de donnees existante necessite de connaitre et de comprendre la structure et la semantique des donnees. Les travaux presentes dans cette these portent sur l'extraction de connaissances a partir des donnees, connaissances liees aux dependances fonctionnelles satisfaites par une base de donnees. Un cadre de travail pour l'analyse de schemas de bases de donnees est propose. Ce cadre s'appuie sur la notion theorique de treillis de fermes et sur l'extraction, a partir d'une relation, de fermes particuliers appeles ensembles en accord. Ces derniers forment une representation alternative equivalente de l'information contenue dans un ensemble de dependances fonctionnelles. Plusieurs methodes pour la decouverte des ensembles en accord a partir d'une relation de base de donnees sont presentees et evaluees. Les ensembles en accord sont vus comme le point de depart commun permettant de concevoir des algorithmes performants pour resoudre un ensemble de problemes : inference des dependances fonctionnelles, inference des dependances fonctionnelles approximatives, inference des cles, generation de relations d'armstrong, tests de formes normales. Certains de ces algorithmes ont ete implementes et evalues experimentalement afin de montrer leur efficacite et leur interet pratique.