Une méthode rapide d'appariement d'images stéréoscopiques : application à la perception de l'environnement d'un véhicule routier
Institution:
BesançonDisciplines:
Directors:
Abstract EN:
Passive stereo vision is a well known approach for recovering 3-D information from two or more images of a scene observed from different viewpoints. The key problem in this approach is the matching process, which is difficult to solve and computationally expensive. In the robot vision domain, this problem is generally simplified by making hypotheses about the type of objects being observed and their visual environment so that structural features, such as corners or vertical straight lines, can be more or less easily extracted. Unfortunately, setting-up a conventional stereo vision system on board a moving vehicle for real-time obstacle detection is difficult because, in the road environment, the features are too numerous to allow a reliable matching within an acceptable computer time. In this thesis, we propose a new method to achieve real-time edge stereo matching. A procedure is first applied to extract edges from the left and right linear images. Each edge is characterized by its position in the image, the magnitude and the sign of the gradient. Based on a global searching approach, the stereo matching method consists in affecting a score to each pair of edges, which respects the position and slope constraints. This score represents the matching quality of a pair of edges. It is calculated thanks to a voting process, which is based on three global constraints : uniqueness, ordering and smoothness constraints. We present afterwards a procedure for weighting the scores of the possible matches by using the gradient magnitudes of the edges. The weight affected to each pair of edges is calculated by comparing their gradient magnitude. This comparison supposes that important weights are affected to the pairs of edges for which the gradient magnitudes are close (and vice-versa). Finally, we propose another way for making use of the gradient magnitudes of the edges to perform stereo matching. It consists in matching edges at different levels, from significant edges to less significant ones. At each level, the process starts by selecting significant edges with respect to their gradient magnitude. The selected edges are then matched and the obtained pairs are used as reference pairs for matching less significant edges in the next level. [. . . ]
Abstract FR:
La stéréovision passive est une approche très utilisée pour la reconstruction 3-D à partir d'images prises sous des angles de vue différents. Le problème clé de cette approche est celui de la mise en correspondance de primitives extraites d'images stéréoscopiques. Ce problème a une nature combinatoire et la complexité des algorithmes de mise en correspondance constitue souvent un handicape face à des applications temps réel, telles que la détection d'obstacles à l'avant d'un véhicule routier. Dans cette thèse, nous proposons une nouvelle méthode, à la fois robuste et rapide, pour mettre en correspondance les points de contour extraits d'images stéréoscopiques. À l'issue de leur extraction par dérivation d'une image brute, les points de contour sont caractérisés par 3 attributs : la position dans l'image, le signe et l'amplitude du gradient. Basée sur une approche de recherche globale, notre méthode de mise en correspondance consiste à attribuer un score à chaque couple de points de contour vérifiant deux contraintes locales : les contraintes de position et de signe du gradient. Ce score, qui représente une mesure de qualité de l'appariement d'un couple de points de contour, est calculé en utilisant une technique de vote qui exploite 3 contraintes globales : les contraintes d'unicité, d'ordre et de continuité de la disparité. Nous présentons ensuite une technique de pondération des scores des couples en exploitant l'attribut de l'amplitude du gradient des points de contour. Le coefficient de pondération associé à chaque couple est calculé en comparant les amplitudes du gradient des points de contour. Cette comparaison s'effectue de telle sorte que plus les amplitudes des points de contour d'un couple sont proches, plus le poids affecté à ce couple est important (et inversement). Enfin, nous proposons une autre façon pour exploiter l'amplitude du gradient des points de contour dans notre procédure de mise en correspondance. Il s'agit de mettre en correspondance les points de contour hiérarchiquement et à plusieurs niveaux de recherche, en partant des points de contour les plus significatifs (ayant des fortes amplitudes) vers les points de contour les moins significatifs (ayant des faibles amplitudes). À partir d'un niveau de recherche donné, les points de contour les plus significatifs sont sélectionnés et mis en correspondance. Les couples de points de contour appariés sont ensuite utilisés comme couples de référence pour mettre en correspondance les points de contour restants au niveau de recherche suivant, en réappliquant la même stratégie. Les performances de notre méthode de mise en correspondance sont évaluées et comparées avec les performances d'autres méthodes récentes, dans le cadre de la détection d'obstacles à l'avant d'un véhicule en utilisant la stéréovision linéaire.