thesis

Apprentissage et prédiction de séquences sensori-motrices : architecture neuromimétique pour la navigation et la planification d'un robot mobile

Defense date:

Jan. 1, 2006

Edit

Institution:

Cergy-Pontoise

Disciplines:

Directors:

Abstract EN:

Navigation of an autonomous mobile robot in an unknown environment is a complex task that raises numerous issues in perception, categorisation, planning, and motor control. Solving all these problems in an integrated manner remains a challenge for roboticians. Thus, we propose a unified neuronal framework, based on the modeling of different parts of the mammalian brain’s functionalities: the hippocampus, the prefrontal cortex and the basal ganglia. Key topics are the multi-modal data integration like vision (the prevailing input), path integration, motivation, and also the inner and outer interactions between the structures. A first part of our work consists in modeling neural networks able to learn and predict sensory-motor combinations (transition cells) which are inputs of a cognitive map used to plan according to conflicting motivations. The cognitive map is learned without using any Cartesian coordinates nor occupancy grids. Already known transitions are used in exploration in order to preferentially explore unknown zones to reduce exploration time and enhance the completion of the cognitive map. Links of this map are learned or reinforced according to the behavior and enable to take into account dynamical changes of the environment. Exploration periods may be alternated with planning periods. The second part of this thesis brings an interesting solution for computing and selecting the final movement to perform. It also gives a stable motor control. Instead of using a (( Winner Takes All )) mechanism to select the movement, we increase the planned movement accuracy via a soft competition. Hence several movements are proposed and fed in another layer where the final motor command is obtained as the stable solution of a dynamical system: a one dimensional neural field coding for the heading direction. This field allows to endow the system with a final movement selection leading to a better movement generalization and consequently to a more reliable movement while planning. Our model gives a control architecture allowing to exhibit on a mobile robot navigation behaviors inspired from biology. This architecture can be considered as an attempt to explain underlying mechanisms implemented by mammals for these kind of behaviors. Furthermore, we can list the following benefits of our model: on-line localization, active exploration, planning and mapping in an uncompletely explored environment. These benifits cast an original light on the S. L. A. M problem (Simultaneous Localization and Map building of an unknown environment).

Abstract FR:

La navigation autonome d’un robot mobile en environnement inconnu est une tâche complexe qui soulève de nombreux problèmes liésà la perception, la categorisation, la planification et au contrôle moteur. Résoudre l’ensemble de ces problèmes de manière intégrée demeure un défi pour les roboticiens. Ainsi nous proposons une architecture neuronale unifiée, fondée sur la modélisation de fonctionnalités de différentes parties du cerveau des mammifères: l’hippocampe, le cortex prefrontal et les ganglions de la base. L’intégration de données multimodales telles que la vision (entrée principale), l’intégration de chemin, et la motivation ainsi que les interactions internes et externes des différentes structures en sont des points importants. Une première partie de notre travail a ainsi consisté à modéliser des réseaux de neurones permettant l’apprentissage et la prédiction d’associations sensorimotrices, sous la forme de cellules de transition, supports d’une carte cognitive employée afin d’effectuer une planification selon des motivations parfois contradictoires. . . L’apprentissage de la carte cognitive, lors de périodes d’exploration et réalisé de façon latente, sans utiliser de coordonnées cartésiennes ni de grille d’occupation. Les liens de cette carte sont appris ou renforces selon le comportement supportant ainsi des changements dynamiques de l’environnement. Les périodes d’explorations peuvent être entrecoupées de période de planification. La deuxieme partie de cette these apporte à notre modele une solution pour explorer de fa¸conpréférentielle les zones inconnues de l’environnement et d’améliorer la précision du mouvement planifié via une compétition souple (à plusieurs gagnants), offrant une meilleure généralisation du mouvement et par conséquent un déplacement plus précis en planification. La commande motrice finale correspond à la solution stable d’un système dynamique : un champ neuronal à une dimension. Notre modele fournit ainsi une architecture de controle capable d’exhiber sur une plate forme robotique des comportements de navigation inspirés de la biologie. Cette architecture peut donc être considérée comme une tentative d’explication des mécanismes sous-jacent mis en oeuvre par les mammifères dans ces types de comportement. D’autre part les capacités de notre modèle en terme de localisation, d’exploration active, de planification et de cartographie en ligne d’un environnement incomplètement exploré en font une proposition originale au problème du S. L. A. M (Simultaneous Localization and Map building of an unknown environment).