Filtrage et selection d'attributs en apprentissage
Institution:
BesançonDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
L'alternative la plus raisonnable permettant aux outils de fouille de donnees (data mining) d'apprehender les bases de donnees volumineuses reside dans le pre-traitement de celles-ci. Notre attention s'est par consequent portee sur la reduction de la dimension des ensembles d'apprentissage et plus precisement la reduction du nombre d'attributs. Cette derniere peut etre realisee de differentes manieres. La selection de variables (feature selection) a fait l'objet de nos travaux et plus particulierement le filtrage d'attributs. Dans ce cadre, nous proposons un nouvel algorithme, l'algorithme du pouvoir discriminant, dont l'objectif est l'obtention d'un sous-ensemble minimal d'attributs, c'est a dire un sous-ensemble necessaire et suffisant a la discrimination des concepts. Il s'appuie sur deux nouveaux criteres de selection bases sur la comparaison par paires d'objets, l'un myope : le pdbut, l'autre contextuel : le pdobut. Notons que, afin de situer nos criteres par rapport au foisonnement de criteres statistiques, nous les avons exprime sous forme contingencielle. Le couplage de ces nouveaux criteres avec l'algorithme du pouvoir discriminant permet la detection des variables non pertinentes, redondantes et correlees et conduit a la determination d'un sous-ensemble minimal d'attributs. Nous avons programme notre algorithme, puis il a ete integre dans la plate-forme d'extraction des connaissances a partir des donnees (knowledge discovery in databases) sipinaw grace a laquelle nous avons pu realiser une evaluation empirique, aussi bien directe que indirecte, sur divers ensembles d'apprentissage de reference.