thesis

Une approche comparative combinatoire pour la prédiction de gènes chez les eucaryotes

Defense date:

Jan. 1, 2003

Edit

Disciplines:

Authors:

Abstract EN:

This work deals with a computational genome processing problem : eukaryotic gene prediction. More specifically, we try to determine with accuracy the regions coding for proteins. It is possible to use sequence comparison due to the fact that coding regions (exons) are in general more conserved than non coding regions and are delimited by signals. We first present different methods related to this problem. Then we describe a new method which considers a gene as an assembly of exons that are not independent. This method tries to be as generic as possible, takes possible sequencing errors into account and requires quadratic time and linear memory space. It is implemented in the «utopia» software which was tested on different real sequences sets

Abstract FR:

Ce travail porte sur un problème de traitement informatique des génomes qui consiste à prédire les gènes dans les génomes d'organismes eucaryotes. Plus spécifiquement, on cherche à déterminer avec précision les régions qui codent pour des protéines. Une des manières d'aborder le problème est d'utiliser la comparaison de séquences en se servant du fait que les parties codantes des séquences (exons) sont mieux conservées que les parties non codantes et qu'elles sont délimitées par des signaux. On commence par présenter les différentes méthodes qu'on peut relier à ce problème. On décrit ensuite une nouvelle méthode qui envisage un gène comme un assemblage d'exons qui ne sont pas indépendants. Cette méthode se veut aussi générique que possible, prend en compte de possibles erreurs de séquençage et possède une complexité quadratique en temps et linéaire en espace. Elle a été mise en oeuvre au sein du programme «utopia» qui a été testé sur différents jeux de séquences réelles