thesis

Analyse de données transcriptome et protéome pour l’étude des réponses aux stress oxydants et aux métaux lourds

Defense date:

Jan. 1, 2008

Edit

Institution:

Paris 11

Disciplines:

Authors:

Directors:

Abstract EN:

This work aims at studying responses to oxidative stress and heavy metals through transcriptomic and proteomic data analysis, in particular in the cyanobacterium Synechocystis. This organism is a prokaryote largely studied which notably enables to improve the understanding of plants and is easy to manipulate genetically. The approach first involved analysing the transcriptional responses of Synechocystis' genes in stress conditions, particularly in the presence of cadmium or hydrogen peroxide. Methods to predict protein-protein interactions were then developed in order to construct an interaction network. This network was compared to an experimental network in terms of structure. It was then complemented with transcriptomic data previously analysed in order to obtain a more integrated view of the different phenomena and to study the dynamics of functional modules. The results show different phases in the transcriptional responses as well as functional groups of interacting and coexpressed proteins. In addition, the automation of a mixed hierarchical-pyramidal classification method is proposed. A method to identify composition biases between groups of proteins was also developed. Furthermore, a protein-protein interaction prediction tool was developed, of use for all sequenced species. This open-source software, InteroPorc, has been made available and has the great advantage of being flexible since it can be applied to different source interactions. Furthermore this tool can be easily run online through a web interface (http://biodev. Extra. Cea. Fr/interoporc/).

Abstract FR:

Ce travail a pour objet l'analyse de données transcriptome et protéome pour l'étude des réponses aux stress oxydants et aux métaux lourds, en particulier chez la cyanobactérie Synechocystis. Cet organisme procaryote permet notamment d'aider à la compréhension des plantes tout en étant facilement manipulable génétiquement. La démarche a d'abord consisté à analyser les réponses transcriptionnelles des gènes de Synechocystis en conditions de stress, notamment en présence de cadmium ou de peroxyde d'hydrogène. Des méthodes de prédiction d'interactions protéine-protéine ont ensuite été développées afin de construire un réseau d'interactions. Ce dernier a été comparé à un réseau d'interactions identifiées expérimentalement, notamment en termes de structure. Puis il a été complété avec les données de transcriptome précédemment analysées, afin d’obtenir une vision plus intégrée des différents phénomènes et d’étudier la dynamique des modules fonctionnels. Les résultats font apparaître différentes phases dans les réponses transcriptionnelles, ainsi que des groupes fonctionnels de protéines en interaction et co-exprimées. De plus, l'automatisation d'une méthode de classification mixte hiérarchique-pyramidale est proposée. Une méthode d'identification de biais de composition entre des groupes de protéines a aussi été développée. Par ailleurs, un outil de prédiction d'interactions protéine-protéine, applicable à toutes les espèces séquencées, a été développé. Ce logiciel open-source, InteroPorc, présente l'avantage d'être flexible, puisqu'il peut s'appliquer à différents jeux d’interactions sources. En outre, l’outil est facilement utilisable en ligne à travers une interface web.