thesis

Représentation spatiale et exploration virtuelle des génomes : une approche globale pour l'analyse des éléments architecturaux des séquences

Defense date:

Jan. 1, 2004

Edit

Institution:

Paris 11

Disciplines:

Authors:

Directors:

Abstract EN:

DNA sequences are often represented by a succession of four nucleotides: A, C, G and T. Even if this representation allows to study the linguistics and syntax of DNA sequences, it remains textual, local and monodimensional and does not provide any visual, local nor spatial information. However, DNA is a three-dimensional structure forming a double helix which can bend and create long distance interactions. The aim of this thesis is to propose a new approach of the genomic sequences in order to enrich classic analyses with three-dimensonal criteria. The modelling of these 3D DNA sequences is based on a biophysical model of spatial conformation of DNA. Such a representation raises problematics both in computer science - concerning Virtual Reality for scene management, interaction, data representation and associated algorithms - and in Bioinformatics of genomes. These different aspects, which form the pluridisciplinary nature of this thesis, have been treated through the software program tool ADN-Viewer that I have developed. Two directions have been taken during this work and should endure after this thesis. The first one is to come close as much as possible to the DNA biological reality. Our work represents a very first step in this sense and has to be enriched by new criteria of spatial conformation and by the integration of biological partners of DNA. The second direction is to exploit the three-dimensional structure of DNA as a representation among others to explore, treat and analyze the biological content of sequences.

Abstract FR:

Les séquences d'ADN sont souvent représentées par une succession de 4 nucléotides A, C, G, T. Même si cette représentation permet d'étudier la linguistique et la syntaxe des séquences d'ADN, elle demeure textuelle, locale et monodimensionnelle et ne fournit aucune information visuelle, globale ni spatiale. Or, l'ADN est une structure à trois dimensions formant une double hélice qui peut se courber et créer des interactions longue distance. L'objectif de cette thèse est de proposer un nouveau point de vue sur les séquences génomiques afin d'enrichir les analyses classiques avec des critères tridimensionnels. La modélisation de ces séquences 3d d'ADN se base sur un modèle bio-physique de conformation spatiale de l'ADN. Une telle représentation soulève des problématiques à la fois en Informatique - en Réalité Virtuelle pour la gestion de scène, l'interaction, la représentation des données et les algorithmes associés - et en Bioinformatique des génomes. Ces différents aspects, qui font le caractère pluri-disciplinaire de cette thèse, ont été traités à travers l'outil logiciel ADN-Viewer que j'ai développé. Deux directions ont été suivies durant ces travaux et doivent perdurer au-delà de cette thèse. La première est de se rapprocher le plus possible de la réalité biologique de l'ADN. Nos travaux représentent une toute première étape en ce sens et doivent être enrichis par de nouveaux critères de conformation spatiale et par l'intégration des partenaires biologiques de l'ADN. La seconde direction est d'exploiter la structure tridimensionnelle de l'ADN comme une représentation parmi d'autres pour explorer, traiter et analyser le contenu biologique des séquences.