Neural underpinnings of reinforcement-based learning and decision-making in humans
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Reinforcement learning is a psychological phenomenon pervasive in human behaviour. In simple terms, it deals with the ability of learning to improve one’s future choices in order to maximize the occurrence of rewards and minimize the occurrence of punishments. It emerged that reward learning depends on the midbrain dopaminergic neural activity and that reward learning behavioural variables are represented in the ventral fronto-striatal circuits. However several fundamental questions remained still unanswered. One opened question regarded the neural bases of punishment learning. From our studies it appeared that punishment learning depends on both the correct functioning the dopaminergic transmission and on the integrity of specific brain areas, namely the dorsal striatum and the anterior insula. These regions would represent an opponent system effectuating for punishment learning the same operations effectuated by the ventral frontal-striatal circuit for reward learning. Another opened question in the field of reinforcement learning regarded how the value of the available option is represented in the brain and how representations determine the upcoming choices. We provided with our experimental studies insights on how the value of available options is represented in the human brain. More precisely we showed that in the case of inter-manual choice the options values are represented in the ventral frontal-striatal circuit contralateral to the choice-executing hand. This inter-hemispheric dissociation might be generalized to a topography of representations of the reinforcement learnt values
Abstract FR:
L’apprentissage par renforcement est un phénomène psychologique omniprésent dans le comportement humain. En termes simples il s’agit de la capacité d’apprendre à améliorer ses choix futurs dans le but de maximiser l’occurrence des récompenses et de minimiser l’occurrence des punitions. Cependant plusieurs questions fondamentales sont restées sans réponse. Une question encore débattue concerne les bases neurales de l’apprentissage par punition. D ‘après nos études l’apprentissage par punition semble être dépendant à la fois d’un fonctionnement correct de la transmission dopaminergique et de l’intégrité de structures cérébrales spécifiques, notamment le striatum dorsal et l’insula antérieure. Ces régions constitueraient ainsi un système opposant, effectuant pour les punitions les mêmes opérations que celles effectuées par les circuits striato-ventraux pour les récompenses. Une autre question débattue dans le domaine de l’apprentissage par renforcement concerne la façon dont les valeurs des options disponibles sont représentées dans le cerveau et comme ces représentations influencent les choix futurs. Nous avons apporté avec nos études expérimentales des éclaircissements sur la façon dont les valeurs des options disponibles sont représentées dans le cerveau humain. Plus précisément, nous avons montré que dans le cas de choix inter-manuel, les valeurs des options sont représentées dans le circuit fronto-striatal ventral, controlatéral à la main qui exécute le choix. Cette dissociation inter-hémisphérique pourrait se généraliser à l’idée d’une topographie de la représentation des valeurs apprises par renforcement