Apprentissage supervisé par génération de règles : le système sucrage
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Face à une quantité de données chaque jour plus importante, la détection de structures et de liens particuliers, l'organisation et la recherche de connaissances exploitables dans cette masse d'information deviennent un enjeu stratégique pour la prise de décision et la prédiction. Ce problème complexe, désigné par fouille de données, possède de multiples aspects. Nous nous sommes intéressés à l'un d'entre eux : l'apprentissage supervisé. Nous proposons une méthode d'apprentissage à partir d'exemples qui se situe à la jonction des méthodes statistiques et de celles basées sur des techniques d'intelligence artificielle. Notre modélisation se base sur la génération automatique de règles de classification et sur une utilisation originale du raisonnement approximatif. La fonction de classement, directement donnée sous la forme d'une base de règles de production, assure la transparence et l'interprétabilité du classifieur. La méthode d'apprentissage proposée est multi-attributs, elle permet de prendre en compte l'éventuel pouvoir prédictif d'une conjonction d'attributs pris simultanément. Le partitionnement de l'espace des entrées permet d'avoir une représentation multivalente des attributs et d'intégrer la notion d'imprécision des données. L'incertitude des règles, également prise en compte, est gérée aussi bien dans la phase d'apprentissage que dans celle de la reconnaissance. Afin d'introduire plus de souplesse et pour pallier les problèmes des frontières dus à la discrétisation, nous proposons la mise en œuvre d'un raisonnement approximatif. L'originalité de notre approche réside dans l'utilisation du raisonnement approximatif proposé, non plus uniquement comme un mode d'inférence et de gestion de connaissances imprécises, mais pour affiner l'apprentissage et valider la base de règles. La méthode proposée a été implémentée dans un système baptisé sucrage et confrontée à une application réelle dans le domaine du traitement d'images. Les résultats obtenus sont très satisfaisants. Ils permettent de valider notre approche et nous autorisent à envisager d'autres domaines d'application.