Contribution à l'étude des modèles d'attention visuelle et du suivi de regard pour améliorer le retour visuel dans les applications 3D interactives
Institution:
Rennes, INSADisciplines:
Directors:
Abstract EN:
In virtual reality, the interaction between a human and a computer can be achieved through multiple sensory channels. The visual channel is generally used in order to provide a visual feedback to the user interacting with a virtual environment. The goal of this thesis is to improve this visual feedback by taking into account user’s visual attention in an interactive manner. The first part of this thesis is dedicated to human attention. We wanted to evaluate in real-time the gaze point of a user navigating in a 3D virtual environment using a first-person view. We have first studied human visual attention when walking in a virtual environment and have shown that there are several common behaviors when compared to a real pedestrian walk. We have then proposed a model in order to simulate this behavior. We have included this component in a novel visual attention model able to predict, in real-time, the attention of a user navigating in a virtual environment. Our evaluation has shown that our model was able to predict the users' visual attention more efficiently than existing models. Finally, we have proposed a novel use of visual attention models in order to improve the accuracy of any gaze tracking systems. Our study has shown that our approach could improve the global accuracy of these systems. In the second part of this thesis, we have researched a novel way to improve the visual feedback to the users in order to improve their immersion feelings and perception of a virtual environment. We have proposed a novel use of the gaze point in order to simulate natural visual effects present in human vision: a depth-of-field blur effect and a compensated camera motion. Our study has shown that these effects were strongly preferred by participants when they were computed based on their gaze point, in a more interactive manner.
Abstract FR:
En réalité virtuelle, l'interaction entre un homme et une machine peut être effectuée au travers de multiples canaux sensoriels. Le canal visuel est généralement utilisé afin de fournir à l'utilisateur une visualisation de l'environnement virtuel avec lequel il interagit. L'objectif de cette thèse est d'améliorer ce retour visuel de manière interactive en tenant compte de l'attention visuelle de l'utilisateur. La première partie de cette thèse est dédiée à l'évaluation de l'attention humaine. Nous avons cherché à calculer en temps réel le point de focalisation d’un utilisateur naviguant avec une vue à la première personne dans un environnement virtuel 3D. Pour cela, nous avons d’abord étudié l'attention visuelle humaine lors de la marche en environnements virtuels et avons montré qu'il existe de nombreux points communs avec la marche en situation réel. Nous avons ensuite proposé un modèle permettant de simuler ce comportement visuel. Puis, nous avons intégré ce composant dans un nouveau modèle d'attention visuelle complet permettant de prédire, en temps-réel, l'attention visuelle d'un utilisateur naviguant dans un environnement virtuel 3D. Nos évaluations ont montré que notre modèle est capable de prédire l'attention visuelle des utilisateurs de manière plus efficace que les modèles existant. Enfin, nous avons proposé une nouvelle utilisation des modèles d'attention visuelle dans le but d'améliorer la précision des systèmes de suivi du regard. Notre étude a montré que notre approche pouvait améliorer la précision globale de ces systèmes. Dans la deuxième partie de cette thèse, nous avons cherché à enrichir le retour visuel aux utilisateurs dans le but d'améliorer leur sentiment d'immersion et leur perception de l'environnement virtuel. Nous avons proposé une nouvelle utilisation du point de focalisation dans le but de simuler des effets visuels naturellement présents dans la vision humaine: un effet de flou de profondeur et un mouvement de caméra compensé. Notre étude a montré que ces effets étaient fortement préférés par les utilisateurs lorsqu'ils étaient calculés en fonction de leur point de focalisation, et donc de manière plus interactive.