Exploration des bases incompletes application a l'aide au pretraitement des valeurs manquantes
Institution:
CaenDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Cette these traite du probleme des valeurs manquantes dans le cadre recent de l'extraction de connaissances a partir des donnees (ecd). Une etude des principaux traitements a permis de degager que les principales approches revenaient a completer les valeurs manquantes sur la base de principes relativement elementaires. L'extraction automatique de relations en presence de valeurs manquantes, comme le ferait l'expert sur un nombre limite de cas, pour la prediction des valeurs manquantes, est en effet un point delicat. Dans le but d'extraire les relations en vue d'une completion, nous nous sommes appuyes sur le concept recent des regles d'association en les adaptant au contexte des bases incompletes. Des experiences ont montre que l'algorithme que nous proposons, regles d'associations robustes (rar), retrouve en moyenne cinq fois plus de regles pertinentes que les algorithmes traditionnels. Ce resultat est important puisqu'il permet la fouille des bases incompletes par les regles d'association. Grace a celui-ci nous proposons une methode de completion des valeurs manquantes pour l'ecd : missing values completion (mvc). Mvc se sert de l'algorithme rar pour completer une base en deux etapes : extraction grace a rar de l'information potentielle puis application de ces relations pour la completion. Le resultat est une base completee, utilisable par toute methode de fouille de donnees. Le formalisme des regles permet en outre un traitement declaratif et interactif, comprehensible par l'utilisateur : rar permet de constituer un reservoir de regles formant une connaissance visualisable et modifiable.