
Weighted Genome Rearrangements

Defense date:

July 10, 2020





Abstract EN:

Recent advances in sequencing technologies revealed the ubiquity of genome rearrangements between each and every one of us. These large scale mutationsrearrange segments of chromosomes and have a profound impact on genetic variation, disease, and evolution. The study of the consequences of rearrangements along with their molecular mechanisms, however, is still in its infancy.Given extant genomes, we are interested in tracing back the evolutionary rearrangement scenarios that transformed their least common ancestor into the genomes that we observe today. This helps not only to reveal evolutionary relationships between organisms, but also provides a window for the study of genome rearrangements themselves.The central computational problem in this subfield of comparative genomicsis that of finding optimal rearrangement scenarios transforming one genome into another. Historically all rearrangements were treated as being equally possible, and optimal scenarios were those that contained the minimum number of rearrangements. Recent advances in biology, however, allow us to devise much more sophisticated models. We present a short survey of the existingwork on using biological constraints for genome rearrangements, and argue that a much more flexible approach is necessary to accompany the influx of newly available biological data.In this work we propose an extremely general framework for genome rearrangements with biological constraints. Our main contribution is a polynomial time algorithm that, for an arbitrary cost function, finds a minimum cost scenario among those of minimum length. Along the way we establish a number of novel links between sorting genomes with double cut and join rearrangements, sorting graphs with 2-breaks or edge swaps, sorting permutations with mathematical transpositions, sorting strings with interchanges, and token swapping on graphs.

Abstract FR:

Un réarrangement génomique est une mutation qui modifie la structure des chromosomes voir même leur nombre dans un génome. Outre des fusions et des fissions de chromosomes, ces réarrangements comprennent des délétions, des insertions et des inversions de segments chromosomiques. Deux extrémités de chromosomes différents peuvent également être échangées au cours d'une translocation. L'ensemble de ces mutations constitue un scénario évolutif de réarrangements entre les espèces. Nous nous sommes intéressés à la reconstruction des scénarios de réarrangements entre espèces animales.Notre projet associe des outils mathématiques et algorithmiques avec la compréhension biologique actuelle des réarrangements génomiques. D'un point de vue biologique, notre objectif est de lier génétique et épigénétique aux réarrangements dans les deux sens:1) nous développons une méthodologie pour étudier des caractéristiques génétiques et épigénétiques associées aux réarrangements,2) et inversement pour trouver des scénarios de réarrangements guidés par de telles caractéristiques génétiques et épigénétiques.La principale contribution de cette thèse est la suivante. Nous présentons un cadre sur le modèle de réarrangements double cut and join avec des poids arbitraires. Dans ce cadre un scénario de poids minimum peut être trouvé en temps polynomial parmi les scénarios de longueur minimale pour deux génomes à contenu génétique identique et sans doublons.En plus de cela, nous établissons un certain nombre de nouvelles correspondances entre les divers problèmes de tri. Ces problèmes incluent le tri des génomes avec des réarrangements dits Double Cut and Join, le tri des graphes avec 2-breaks ou edge swaps, le tri des permutations avec des transpositions, le tri des chaînes avec des échanges et l'échange de jetons sur les graphes.