thesis

Analyse combinatoire des réarrangements chromosomiques et reconstruction des génomes ancestraux chez les eucaryotes

Defense date:

Jan. 1, 2013

Edit

Institution:

Paris 6

Disciplines:

Abstract EN:

Chromosomal rearrangements are large scale mutations that are responsible for changing the order, the orientation and/or the copy number of genes along chromosomes. How to follow the evolution of chromosome structure and how to reconstruct ancestral genomes are important questions in biology. However, the combinatorial dimension of the problem as well as the very large amount of available data imply a multidisciplinary approach of the questions. In this thesis, we revisited the existing computational approaches and we redefined the biological objects in order to better answer the initial biological questions. We have developed an original method, which can be applied to eukaryotic multi-chromosomal genomes. This method comprises four distinct algorithms, which: (i) identify synteny blocks, allowing them to overlap, to be included or to be duplicated (ii) reconstruct phylogenetic trees from the synteny blocks adjacencies (iii) identify chromosomal rearrangements accumulated between two genomes and (iv) reconstruct ancestral genomes based on the location of rearrangements along the branches of the phylogenetic tree. Each of these parts has been implemented and applied to 19 yeast genomes and 13 vertebrate genomes. The results were validated by comparison to existing reconstructions and were used for comparative analysis of genome evolution between yeast and vertebrates.

Abstract FR:

Les réarrangements chromosomiques sont des mutations de grande taille responsables du changement de l'ordre, de l'orientation et/ou du nombre de copie des gènes le long des chromosomes. La reconstruction de l'histoire évolutive des génomes et la reconstruction des génomes ancestraux sont des questions importantes en biologie. Mais la dimension combinatoire du problème et la quantité de données rendent indispensable une approche pluridisciplinaire. Au cours de ce travail de thèse, nous avons cherché à revisiter les différents concepts déjà existants, en redéfinissant les objets biologiques étudiés, en vue de revenir aux questions biologiques initiales. Nous avons ainsi développé une méthode complète et originale, pouvant s'appliquer aux génomes eucaryotes contenant plusieurs chromosomes. Elle se décompose en quatre algorithmes distincts qui : (i) identifient les blocs de synténie, en permettant qu'ils puissent se chevaucher, s'inclure ou être dupliqués ; (ii) reconstruisent les arbres phylogénétiques à partir des relations d'adjacence entre les blocs de synténie ; (iii) identifient les réarrangements chromosomiques accumulés entre deux génomes et (iv) reconstruisent les génomes ancestraux en s'appuyant sur la localisation des réarrangements le long des branches de l'arbre phylogénétique. Chacune de ces parties a été implémentée et appliquée à 19 génomes de levures et 13 génomes de vertébrés. Les résultats ont été validés par comparaison aux reconstructions existantes et ont pu servir à l'analyse comparée de l'évolution des génomes entre levures et vertébrés