Détection et catégorisation d'objets dans une vidéo
Institution:
CaenDisciplines:
Directors:
Abstract EN:
Video content analysis is essential for efficient and intelligent utilization of vast multimedia databases. In video sequences, object-based extraction techniques are important for content-based video processing in many applications. In this context, it is important to have methods and algorithms which can execute very fast in order to provide a fast outline of the video content. In this thesis, we are interested particularly to problem of objects extraction and categorization from video sequences. We first propose to use a global active contours approach to extract some Regions of Interest (ROIs). To improve the accuracy of the extracted moving objects in video sequences, we have proposed to incorporate optical flow information into the active contour function. The second part of this thesis address the problem of object categorization in a video sequences, specially for human actions, using spectral clustering. We proposed an approach of posture estimation and we described a methodology to automatically recognize the human activities embedded in practical applications. We proposed to analyse the human behaviour. It refers to the extraction of low-level information, such as his silhouette, the location of the face and the classification of his facial expression. On the other hand, we proposed an new approach of categorization based on spectral analysis that facilitate the reduction of the dimensionality and allows the interpretation of the postures and behavior of persons : walking, running etc. )
Abstract FR:
Dans le contexte de l’analyse vidéo, il est important d’avoir des méthodes de segmentation intelligentes et rapides pour fournir un aperçu rapide du contenu des séquences vidéo. Dans le cadre de cette thèse, nous nous intéressons particulièrement à des problèmes d’extraction et de catégorisation des objets vidéos. Pour l’extraction, nous proposons d'utiliser l'approche par contours actifs globaux basés régions qui permet de localiser rapidement les objets d'intérêt. Pour cela, nous avons utilisé des critères de segmentation qui prennent en compte l’homogénéité et les attributs perceptuels pour définir une compétition entre la région d'intérêt et le fond. Pour améliorer la méthode de détection et de suivi de données vidéo, nous avons étendu la formulation énergétique de notre modèle des contours actifs globaux en incluant une force supplémentaire issue du calcul du flot optique. Dans une seconde partie, nous abordons le problème de l’interprétation du comportement humain (mouvement et gestuelles) dans les séquences vidéo. Les buts poursuivis sont multiples. D’un côté, nous procédons à une analyse du mouvement humain. Le terme “analyse” concerne ici l’extraction d’informations bas-niveau, tels que la silhouette de la personne, la localisation de son visage, l’extraction et classification de son expression faciale. D’un autre côté, on propose une méthode de catégorisation qui faciliterait la réduction de données et de dimensionnalité des données, ainsi que l’interprétation du comportement humain. Il s’agit de la reconnaissance de démarches (marche, course etc. ), de postures (debout, accroupi, etc. ), ou entre des personnes (gestes, attitudes etc. ).