Une approche basée sur le double paradigme « ontologie-architecture de modèles » appliquée au traitement de collections d'images dans le domaine biomédical : XenOnt
Institution:
DijonDisciplines:
Directors:
Abstract EN:
The research work described in this thesis pertains to software applications that generate significant volumes of data. The produced images convey strong domain-specific semantics. Their graphic nature does not lend itself easily to making use of segmentation tools (diversity among images of the domain, among techniques used to generate images, etc. ). Today, image annotations are carried out (done) by domain experts. The costs brought about by these annotations result into many collections not being annotated and thus not being much or at all exploitable outside the project for which they have been produced. In order to reduce annotation costs, we strive to lower the level of expertise needed for making image annotations (most often by a domain technician). As there is no question of accepting a decrease in annotation quality, it is absolutely essential to guarantee that image annotations conform to the domain. In order to implement our solution, we rely on : the domain knowledge as it is available (models, ontologies, standards, etc. );the knowledge of the project within whose scope the image collection has been produced (techniques, experience, etc. ); a generic model of an image database developed as part of the IkoSem project. The method that we propose consists of consolidating the knowledge in a double architecture of models and ontologies. The coupling allows to help a person making image annotations by ensuring that these annotations conform to the domain knowledge.
Abstract FR:
Le travail de cette thèse se situe dans le cadre d'applications qui produisent des volumes importants d'images. Les images produites véhiculent une sémantique forte, spécifique au domaine, et leur nature graphique ne permet pas de mettre aisément en oeuvre des outils de segmentation (diversité entre les images du domaine, entre les techniques utilisées pour la génération des images, etc. ). À ce jour, l'annotation est effectuée par des experts du domaine. Le coût engendré par ces annotations fait que beaucoup de collections ne sont pas annotées et sont donc peu ou pas exploitables en dehors du projet pour lequel elles ont été générées. Pour diminuer le coût d'annotation, notre stratégie consiste à abaisser le niveau d'expertise de la personne qui va effectuer les annotations (le plus souvent un technicien du domaine). Comme il n'est pas question d'accepter une baisse de la qualité des annotations, il est impératif de garantir que les annotations resteront conformes à la connaissance du domaine. Pour développer notre solution, nous nous appuyons sur : la connaissance du domaine telle qu'elle est disponible (modèle, ontologies, standards, etc. ) ; la connaissance du projet dans le cadre duquel la collection d'images a été générée (techniques, expériences,. . . ) ; un modèle générique de Base de Données Images développé dans le cadre du projet IkoSem. La méthode que nous proposons consiste à consolider la connaissance dans une architecture couplée de métamodèles et d'ontologies. Le couplage permet d'épauler la personne qui effectue les annotations en assurant que ces annotations sont conformes à la connaissance du domaine.