thesis

Modèle markovien de détection de mouvement dans les séquences d'images : approche spatio-temporelle et mises en œuvre temps réel

Defense date:

Jan. 1, 1995

Edit

Institution:

Grenoble INPG

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Ce travail aborde le probleme de l'analyse du mouvement dans les sequences d'images et se focalise plus precisement sur la detection de mouvement: l'objectif est de localiser les objets mobiles d'une scene filmee avec une camera fixe, la seule information de mouvement prise en compte etant la difference entre deux images successives. Le cadre mathematique general est la theorie des champs de markov. Les informations contenues dans une sequence d'images evoluant au cours du temps, une detection de mouvement n'est pertinente que si elle est faite en temps reel. Par ailleurs, a partir d'une image isolee d'une sequence, aucune information de mouvement n'est disponible. Il faut au minimum deux images successives pour pouvoir calculer la vitesse d'un objet et trois images sont necessaires pour evaluer son acceleration. Cet exemple illustre le fait que si on integre les informations contenues dans un plus grand nombre d'images consecutives, la caracterisation du mouvement est plus complete. Les algorithmes de detection de mouvement presentes dans ce rapport s'efforce de respecter ces deux contraintes: cadence de traitement rapide et integration de l'information temporelle bien qu'elles soient contradictoires (plus on prend en compte d'images, plus la quantite de calculs est importante). Le premier algorithme propose (appele algorithme spatial) ne prend en compte que trois images successives de la sequence. La recherche du champ des etiquettes cachees a lieu a un instant donne. Apres avoir valide le bon comportement de l'algorithme grace a des tests sur une station de travail, nous nous sommes interesses a sa mise en uvre sur des materiels specifiques disponibles au jour d'aujourd'hui afin d'en accelerer la cadence de fonctionnement. Trois solutions materielles ont ete envisagees: programmation d'une machine parallele, mapping de l'algorithme sur un reseau resistif vlsi analogique et utilisation d'une carte a base de dsp. La cadence de traitement atteinte lors du traitement d'images de taille 128 x 128 est encourageante (entre 3 et 10 images/seconde selon le cas). Pour le second algorithme propose (appele algorithme spatio-temporel), la sequence d'images n'est plus consideree comme une succession d'images mais comme un volume de pixels qui est decoupe en tranches temporelles de n images successives (n 5). Sur une tranche d'images donnee, on recherche le volume d'etiquettes le plus probable etant donne le volume des observations associe. La relaxation a lieu sur tout le volume constitue par les n images. Cette formulation presente l'avantage d'integrer l'information temporelle sur un horizon plus etendu ce qui s'avere particulierement efficace pour l'analyse de sequences bruitees ou pour la reconstruction complete des zones de glissement des objets sur eux-memes. Nous avons pour finir insere l'algorithme de detection spatio-temporel dans un cadre multi-resolution spatio-temporelle. La structure hierarchique des donnees consiste a construire une pyramide de sequences au moyen d'une serie de filtrages passe-bas et de sous-echantillonnages dans chacune des trois directions x, y, et t. Il en resulte une amelioration des performances de l'algorithme pour la detection des mouvements tres lents et des objets peu textures. Celle-ci provient de l'amelioration des observations prises en compte par le modele