Conditionnement opérant et problèmes décisionnels de Markov : théorie et expérimentations chez l'homme et l'animal
Institution:
Lille 3Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Dans un problème décisionnel de Markov, un agent doit apprendre à maximiser la quantité de récompenses qu'il peut collecter durant ses interactions avec son environnement. Ce genre de problèmes est résolu par les algorithmes dits d'apprentissage par renforcement. Bien que modélisant le comportement à un niveau moléculaire, ils permettent de comprendre comment un animal peut optimiser une quantité molaire de son environnement. Cette thèse essaie de renforcer leur validité en tant que modèle de la performance dans le conditionnement opérant et de montrer leur pertinence pour la compréhension de l'apprentissage chez l'homme. Nous montrons comment divers modèles du comportement dans les programmes de ratio variable peuvent être obtenus dans le cadre des problèmes décisionnels de Markov. Les prédictions de l'un d'eux sont comparées à des données réelles, ce quipar notre modèle. Puis, dans une série d'expériences menées avec des enfants, nous montrons que la probabilité de renforcement de stimulus utilisés dans une tâche d'appariement symbolique à un modèle est l'une des variables déterminant le choix des sujets. La plupart des résulats de ces études sont prédits et expliqués par une analyse des tâches d'appariement à un modèle menée dans le cadre des problèmes décisionnels de Markov. Ces recherches peuvent être considérées comme représentatives du béhaviorisme théorique, une nouvelle position épistémologique allant au-delà à la fois du béhaviorisme radical et du cognitivisme