
Toward collaborative and contextualized online instrumentation in pervasive and ubiquitous environments

Defense date:

March 22, 2013





Abstract EN:

The main objective of this thesis is to propose the control of 2D object in a remote scene, using a contextualized, collaborative and interactive multimedia. The 2D objects are mainly electronic devices. For the use case in this work, an IP camera is placed in front of the device to control. The generated stream is decoded. The front of the device is identified using image-processing techniques based on natural feature points. Then, an interactive multimedia based on the MPEG-4 binary format for scenes standard is built and broadcasted to the remote users. In order to handle collaboration, we propose a notification mechanism and communication tools to reproduce the “group awareness”, which allows users to apprehend interactions between them. This approach leads us to enrich the MPEG-4 BIFS with the websocket protocol. The use of the semantic web allows us to encode expected sequences of use of the interactive multimedia. Eventually the system provides on the fly interaction adaptations to the end-user. The implementation of a proof of concept is illustrated in contributions to two open source projects : Ocelot ( and GPAC (

Abstract FR:

Le principal objectif de cette thèse est de contrôler des objets à deux dimensions dans des scènes distantes, en utilisant des flux multimédia interactifs et contextualisés. Pour le cas d’usage de ces travaux, ces objets sont des instruments de mesures de physique. Une caméra IP est placée devant l’instrument à contrôler. Le flux généré est décodé. L’instrument est reconnu par des méthodes de traitement d’images basées sur les points caractéristiques locaux. Un flux multimédia interactif basé sur le standard « MPEG-4 binary format » construit et envoyé aux utilisateurs distants. Pour supporter la collaboration, nous proposons un mécanisme de notifications ainsi que des outils de communication pour reproduire la « sensation de groupe ». Cela permet aux utilisateurs d’appréhender les interactions entre eux. Cette approche nous a conduit à enrichir le standard MPEG-BIFS avec le protocole websocket. L’utilisation du web sémantique nous permet d’encoder des séquences d’interaction prévues avec l’instrument. Le système permet également de proposer l’adaptation à la volée du flux multimédia. L’implémentation d’un prototype est illustré dans la contribution à deux projets open source : Ocelot ( et GPAC (