Explorer pour reconnaître : approche probabiliste pour la reconnaissance visuelle de lieux par un robot mobile
Institution:
Paris 11Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Dans cette thèse, nous présentons deux modèles de reconnaissance et de catégorisation visuelle de lieux pour la robotique. L’idée centrale est de tirer parti des capacités exploratoires du robot pour améliorer la reconnaissance : contrairement aux approches classiques qui tentent de reconnaître des lieux à partir d’images fixes sans prise en compte de la notion de continuité inhérente aux vidéos, nous insistons sur l’utilité d’intégrer les informations récoltées lors de l’exploration. Les scènes visuelles sont encodées au moyen de descripteurs globaux ou localisés autour d’un focus d’attention. L’architecture attentionnelle développée pour détecter les régions saillantes intègre un module de mémoire spatiale qui permet de déterminer les points les plus robustes dans le flux vidéo. Ce module utilise un champ neuronal pour représenter l’environnement dans un repère géo-centré. Il permet de garder trace des régions de l’espace précédemment fixées et donc de déterminer les plus stables. Les scènes visuelles sont ensuite classées de façon non supervisée au moyen d’une carte auto-organisatrice. Les prototypes visuels obtenus sont ensuite injectés en entrée de deux modèles. Le premier modèle utilise un classificateur bayésien naïf tandis que le second repose sur une approche stochastique, un lieu étant modélisé sous la forme d’une chaîne de Markov dont les états observables correspondent aux différents prototypes visuels. Finalement, bien que l’environnement soit décrit au moyen de quelques prototypes visuels relativement frustes, l’intégration temporelle des informations permet d’atteindre de bonnes performances en reconnaissance et en catégorisation.