thesis

Identification de gènes à contribution monogénique dans le diabète : Approches bio-informatiques

Defense date:

Jan. 1, 2016

Edit

Institution:

Sorbonne Paris Cité

Directors:

Abstract EN:

Diabetes mellitus represents an heterogeneous group of metabolic disorders characterized by a dysfunction of glycaemia regulation. Common forms are type 1 (T1D) and type 2 diabetes. A large number of susceptibility loci associated with T1D have been identified by genetic studies, however those loci only explain a small part of the genetic contribution to T1D. Our hypothesis is that part of this missing heritability may be explained by genes with a monogenic effect. To identify these rare monogenic forms, my PhD project strategy is to study selected individuals (patients and familles enriched in monogenic forms), integrating whole exome sequencing and linkage analysis results together with available clinical data to identify the responsible genes and mutations. I developped a software to analyze human exome sequencing data. To facilitate the identification of mutations and genes causing monogenic diseases (or with a strong genetic effect) : filtering variants to identify the ones fitting the genetic model, recovering additional information on these variants from public and private databases, computing a prioritization score for each remaining variant and comparing variants between individuals or groups of individuals. This software is available as open-source code We used this software to analyze exome sequencing data from 211 selected diabetic patients. With this analysis we identified several causal mutations in genes already known as monogenic diabetes genes and in several new genes, that are currently at different stages of genetic and functional validation in our laboratory.

Abstract FR:

Le diabète est un groupe de maladies caractérisées par l'altération de la régulation de la glycémie, dont les formes les plus fréquentes sont le diabète de type 1 (DT1) et le diabète de type 2. Les études génétiques ont permis d'identifier un grand nombre de variants associés au DT1, qui n'expliquent cependant qu'une partie de la composante génétique de cette maladie. Notre hypothèse est qu'une partie de cette « héritabilité manquante » pourrait être due à des gènes à contribution monogénique. Afin d'identifier ces formes monogéniques rares, la stratégie appliquée pour mon projet de thèse est d'étudier de façon systématique des individus sélectionnés en intégrant les résultats de séquençage d'exomes et d'analyse de liaison ainsi que les données cliniques disponibles afin d'identifier des gènes responsables de diabète. J'ai développé un outil informatique, distribué en open source, permettant l'analyse des données de séquençage d'exomes humains afin de faciliter l'identification des mutations et gènes responsables de maladies monogéniques : identifier des variants rares compatibles avec les modèles génétiques considérés, croiser cette liste avec des informations additionnelles issues de bases de données publiques et de données propres au laboratoire, calculer un score de priorisation pour chaque variant sélectionné, comparer les variants entre individus ou groupes d'individus. Nous avons appliqué ce programme aux données de séquençage d'exomes de 211 patients diabétiques sélectionnés. Ces analyses ont permis d'identifier des mutations causales dans plusieurs gènes déjà connus comme étant responsables de diabètes monogéniques ainsi que dans plusieurs nouveaux gènes.