Learning by Observation and Induction the Strategies of Humans Placed in a Problem-Solving Context
Institution:
Paris 11Disciplines:
Directors:
Abstract EN:
Learning can occur at any or all levels of the control architecture of an artificial agent, but leaning by imitation, only concerns the lower levels of this control architecture. The agent can learn what is being done by the human demonstrator and, to some extent, how it is being done. No one had yet attempted to make an agent learn human topmost level cognitive processes i. E. Learn why is something being done. Learning this topmost level cognitive process, learning human strategies, was achieved from video footage of humans in a problem-solving situation. Blindfolded human volunteers explored a maze in search of a treasure. The volunteers' strategies included the goals of not getting lost, of not exploring the same place twice, of not bumping into obstacles, etc. They mentally evaluated their strategies and sometimes changed them during the course of their run. Detecting strategy changes is important because it is a way of achieving strategy failure recognition. Attribute selection can be used to learn which are the meaningful sequences to use as the intermediate building bricks between human perception-action pair and human tactics and how to combine these bricks to build a working definition of what a human tactic is. Each strategy can be expressed by a statistical combination of tactics. Being able to give a mathematical definition of a human strategy is a step towards building an engineering blueprint of human intelligence. Our virtual humanoid robot successfully learnt and implemented the human strategies.
Abstract FR:
L'apprentissage peut être effectué à tous les niveaux d'un agent artificiel, mais l'apprentissage par imitation ne concerne que les niveaux inférieurs de l'architecture de contrôle. L'agent peut apprendre ce qui est effectué par le démonstrateur humain et comment cela est fait. Personne n'avait encore essayé de faire apprendre à un agent les processus cognitif humain du niveau supérieur, à apprendre pourquoi quelque chose est fait. Cet apprentissage des fonctions cognitives supérieures fut réalisé à partir de vidéos montrant des être humains placés dans une situation de résolution de problèmes. Des volontaires aux yeux bandés ont exploré un labyrinthe à la recherche d'un trésor. Les stratégies des volontaires incluaient des buts tels que ne pas s'égarer, ne pas fouiller deux fois le même endroit, ne pas se cogner aux obstacles, etc. Ils évaluaient mentalement leurs stratégies et les modifiaient parfois durant un parcours. Détecter les changements de stratégies est important car cela offre une façon de d'indentifier les stratégies perdantes. La sélection d'attribut peut être utilisée pour apprendre quelles sont les séquences significatives à utiliser en tant que briques intermédiaires entre les paires de perception-action humaines et les tactiques humaines, et comment combiner ces paires pour construire un modèle implémentable de tactique humaine. Chaque stratégie peut être exprimée par une combinaison statistique de tactiques. Pouvoir donner une définition mathématique d'une stratégie humaine est un pas vers la construction d'un modèle implémentable de l'intelligence humaine. Notre robot humanoïde virtuel a appris et implémenté les stratégies humaines avec succès.