thesis

Analyse à haute résolution de la structure spatiale des chromosomes eucaryotes

Defense date:

June 21, 2019

Edit

Institution:

Sorbonne université

Disciplines:

Abstract EN:

Genetic information is encoded in DNA, a huge-size nucleotidic polymer. In order to understand DNA folding mechanisms, an experimental technique is today available that quantifies distal genomic contacts. This high-throughput chromosome conformation capture technique, called Hi-C, reveals 3D chromosome folding in the nucleus. In the recent years, the Hi-C experimental protocol received many improvements through numerous studies for Human, mouse and drosophila genomes. Because most of these studies are performed at poor resolution, I propose bioinformatic methods to analyze these datasets at fine resolution. In order to do this, I present Boost-HiC, a tool that enhanced long-range contacts in Hi-C data. I will then used our extended knowledge to compare 3D folding in different species. This result provides the basis to determine the best method for obtaining genomic compartements from a chromosomal contact map. Finally, I present some other applications of our methodology to study the link between the borders of topologically associating domains and the genomic location of single-nucleotide mutations associated to cancer.

Abstract FR:

L’information génétique est portée par la molécule d’ADN, un polymère de nucléotides de très grande taille. Afin de mieux comprendre les mécanismes impactant le repliement de l’ADN, on peut exploiter une technique de génomique qui permet de quantifier les contacts entre régions distales du génome. Cette technique expérimentale appelée ’capture de conformation de chromosome’ (Hi-C) donne des informations quantitatives sur l’architecture et le repliement tridimensionnel des chromosomes dans le noyau. Largement utilisée chez l’Homme, la souris et la drosophile, cette technique a grandement évolué durant ces dernières années, produisant ainsi des données de qualité variable. Jusque-là étudiées à des résolutions assez grossières, notre objectif est d’étudier les données Hi-C déjà publiées à des résolutions plus fines. Pour cela, j’ai développé un outil bioinformatique, Boost-HiC, pour améliorer l’analyse des contacts chromosomiques. Fort de cette expertise, je proposerai alors une analyse comparative des structures spatiales des génomes eucaryotes, permettant de clarifier comment extraire les compartiments génomiques de manière optimale. Cette expertise sera utilisée également pour décrire le lien entre les bordures des domaines topologiques de la chromatine et la position dans le génome humain des mutations ponctuelles prédisposant au cancer.