Contribution aux systemes de classifieurs : etude des mecanismes de specialisation et extension du langage de representation
Institution:
NiceDisciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Les systemes de classifieurs permettent l'acquisition d'une sequence d'actions, se presentant sous la forme de regles de production appelees classifieurs, dans le but d'obtenir une recompense de l'environnement. La dynamique de ces systemes est basee sur un compromis entre exploration et exploitation. L'exploration est realisee par un algorithme genetique dont l'objectif est la creation de nouveaux classifieurs. L'exploitation est quant a elle effectuee par un mecanisme de repartition des sanctions renvoyees par l'environnement: l'algorithme de la bucket brigade. Bien que largement utilises, les systemes de classifieurs presentent des points necessitant des ameliorations. Cette these propose des solutions afin d'eliminer deux des problemes qui nous semblent fondamentaux: la sur-generalisation des classifieurs et leur faiblesse du langage de representation. La fiabilite des classifieurs generaux ne peut etre evaluee par une unique mesure. C'est pourquoi, un nouvel operateur, la retro-specialisation, a ete defini. Il permet de creer des classifieurs specifiques a partir de regles generales ayant participe a l'obtention d'un succes. De plus, afin d'empecher la creation de classifieurs semantiquement incorrects une grammaire a ete utilisee. Des tests sur l'apprentissage du deplacement d'un robot mobile autonome ont montre que tres rapidement le systeme decouvre les classifieurs necessaires a son deplacement. L'amelioration apportee par l'operateur de retro-specialisation n'est pas toujours suffisante. Nous avons donc propose un nouveau langage de representation pour les classifieurs. Nous avons pour cela introduit les schemas relationnels qui permettent l'expression de relations d'egalite ou de difference entre les positions, tout en conservant les proprietes fondamentales des schemas classiques. Ce nouveau mode de representation a ete evalue sur des fonctions booleennes relativement a une typologie de difficulte de ces fonctions obtenue a l'aide de l'analyse de walsh. Les resultats experimentaux sont encourageants puisque l'ensemble solution obtenu est plus parcimonieux et que l'apprentissage se fait plus rapidement