thesis

Structure à partir du mouvement dans une séquence d'images : une approche par réseaux de neurones

Defense date:

Jan. 1, 1998

Edit

Institution:

Grenoble INPG

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Ce travail traite du probleme de la recuperation des parametres de scene et du mouvement a partir d'une sequence d'images (structure a partir du mouvement, structure from motion = sfm). Les algorithmes existants, consideres globalement depuis l'acquisition des images jusqu'a l'extraction des informations sur la scene et le mouvement, sont grands consommateurs de temps de calcul et en outre ils considerent peu le probleme du bruit dans les images. En vue d'une realisation en temps reel robuste a l'egard d'images bruitees, on propose une approche par reseaux de neurones. Different reseaux ont etes definis, chacun pour resoudre un sous-probleme particulier. Apres une extraction des caracteristiques a bas niveau par l'algorithme susan qui detecte les angles, aisement automatise moyennant le reglage de deux parametres, on propose un reseau neuronal appele dac, afin de detecter les correspondances des caracteristiques entre couples d'images. Ce reseau-ci se compose de deux reseaux neuronaux auto-organises couples l'un avec l'autre pendant la phase d'apprentissage. Sa sortie decrit, en plus des correspondances, les occlusions dans chaque image. Cette sortie est appliquee a un autre reseau auto-organisant, appele exin snn, qui effectue la segmentation de l'image en utilisant les informations du mouvement. Cette segmentation (qui peut aussi etre controlee en retour par le module sfm ci apres) donne la possibilite d'employer cet ensemble dans des cas plus generaux de mouvement, a savoir ceux qui concernent les cameras statiques ou dynamiques, etalonnees ou non, avec des objets bougeant de maniere independante. La correspondance peut etre bruitee a la fois par l'extracteur d'images et de caracteristiques et par les outliers provoques par les erreurs en correspondances dues aux occlusions non reperees ou aux discontinuites de la profondeur. A cause de ce probleme, l'etape suivante doit etre tres robuste. Dans ce but, on propose une serie de neurones lineaires et nonlineaires qu i calculent l'mca (minor component analysis) et les tls (total least squares) et on en donne une theorie complete. Le resultat le plus important porte sur l'existence de conditions initiales qui assurent la convergence de ces algorithmes dans la meilleure situation par rapport a la vitesse de convergence. On donne une comparaison avec les neurones existants sur ce probleme et la superiorite de ce nouveau neurone est demontree a la fois theoriquement et experimentalement. Ces neurones, et en particulier ceux qui realisent le constrained total least squares, calculent, soit la matrice essentielle, soit la matrice fondamentale avec precision meme en presence de fort bruit dans les donnees et de 50% de fausses correspondances. Un autre module emploie les memes neurones dans une couche realisent une detection des outliers. Cette detection ameliore la precision des resultats et affine le resultat de la segmentation. En utilisant les memes informations sur la matrice essentielle, d'autres neurones, mca et tls, resolvent le probleme orthogonal de procrustes : ils donnent aussi les parametres de mouvement en utilisant aussi bien les matrices que les quaternions. D'autres reseaux neuronaux, appeles solides neuronaux, sont proposes ici afin d'obtenir les memes informations. Parmi eux on presente le reseau exin nsvd pour resoudre la decomposition en valeurs singulieres et apres on l'applique dans differentes phases du module sfm. Des neurones tls de la derniere etape donnent la carte des profondeurs relatives. D'autres applications des neurones susnommes sont presentees dans ce travail pour l'estimation du mouvement en trois dimensions a partir des donnees et pour le calcul du focus d'expansion (foe). Un autre reseau de neurones original nomme gmr (generalized mapping regressor), qui est capable d'approximer n'importe quelle fonction et relation en plusieurs dimensions, est utilise pour la reconstruction des surfaces de la scene a partir de la carte des profondeurs.