thesis

La maîtrise de l'information scientifique, clé de l' "après séquençage" : développement d'un serveur dédié à l'analyse du génome de la plante modèle Arabidopsis thaliana

Defense date:

Jan. 1, 2001

Edit

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

La connaissance d'un génome complet donne pour la première fois l'opportunité d'étudier un gène dans le contexte génomique auquel il appartient. En particulier ceci permet d'effectuer une analyse fonctionnelle des gènes à travers l'étude des relations existantes, entre les gènes ou les produits des gènes, au sein de ce génome. Afin que l'analyse fonctionnelle d'un gène tire le meilleur parti de la compréhension de ces relations, il est indispensable d'organiser le savoir disponible sur le génome étudié de manière à ce que les gènes liés les uns aux autres puissent être facilement détectés. Nous avons travaillé à un projet visant à développer une base de donnée spécialisée dédiée al̀'analyse fonctionnelle du génome d'Arabidopsis thaliana. Le concept utilisé pour organiser les données au sein de la base repose sur la notion de voisinage. Pour chaque gène, une liste de gênes voisins basée sur différent type de relations est construite. Les gènes (ou produits des gênes) peuvent être liés les uns aux autres selon des critères variés incluant la proximité sur le chromosome, l'homologie de séquences, l'implication dans une même voie métabolique, l'usage du code ou encore la co-citation dans la littérature scientifique. Chaque voisinage permet de donner un éclairage spécifique sur le gène étudié et fournit des éléments pour la recherche de sa fonction. L'exploitation des données bibliographiques associées au génome d'A. Thaliana et l'étude du voisinage par homologie de séquences protéiques constituent une part importante du projet. Dans un premier temps, nous nous sommes intéréssés à la relation qui découle de la co-citation entre deux gènes dans une référence bibliographique, et nous détaillons les problèmes liés au génome que nous avons étudié et la représentation des relations. Dans un deuxième temps, nous nous sommes focalisé sur l'étude des familles construites par homologie de séquence protéique, en utilisant une méthode de comparaison massive de séquences.