Conception et exploitation d'une base de donnees specialisee dediee a l'analyse du genome d'escherichia coli
Institution:
Paris 6Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
L'exploitation des donnees de sequences acquises au cours du sequencage de genomes cellulaires entiers suppose la construction de base de donnees integrant a la fois les donnees brutes issues du sequencage et l'expertise des biologistes a propos de chacun des genes repertories. Le travail presente dans cette these a pour objectif l'elaboration d'un environnement informatique permettant d'organiser, de gerer et d'exploiter un ensemble de donnees biologiques issues d'un meme organisme. Dans un premier temps, le developpement d'une base de donnees specialisee autour du genome d'escherichia coli nous a conduit a definir un modele de structuration des donnees permettant de prendre en compte des connaissances jusqu'a present mal structurees relatives a l'organisation du chromosome bacterien. Ce modele devrait etre applicable a l'etude d'autres organismes procaryotes. Nous avons par ailleurs mis en uvre diverses methodes informatiques permettant d'exploiter la base de donnees. Les resultats biologiques que nous decrivons concernent l'analyse des donnees de la carte genetique et physique d'e. Coli et la caracterisation des genes connus de la bacterie repertories dans la base en fonction de leur utilisation des codons. Trois classes de genes ont ainsi ete identifiees qui se distinguent a la fois par leur fonction et par leur structure. En particulier l'une de ces classes est essentiellement composee de genes impliques dans les echanges horizontaux. Ce resultat nous a conduit a analyser dans le detail les proprietes specifiques des classes de genes d'e. Coli qui sont comparees a celles que nous obtenons pour b. Subtilis et s. Cerevisiae. Ces etudes devraient nous permettre de caracteriser les contraintes specifiques qui agissent sur les sequences nucleotidiques et ainsi de mieux comprendre l'organisation du texte genomique de chacun de ces organismes