Le transcriptome : un domaine d'application pour les statistiques, de nouveaux horizons pour la biologie
Institution:
Evry-Val d'EssonneDisciplines:
Directors:
Abstract EN:
Analysing transcriptome data requires statistical methods in order to provide reliable findings. Amongst the enormous amount of methods available, biologists may have difficulties to choose the most appropriate one for their needs. The existing criterions to compare different methods are either incomplete or use criteria that are not biologically relevant. The organisation of bacterial genomes offers a biologically relevant criterion to compare the methods independently of the goal of the experiment: the operons. We have developed a protocol based on this criterion and compared some classical methods: PCA, ICA, t-test and ANOVA. Furthermore, meta-analysis of transcriptome data is currently developed. These meta-analyses allow the study of new biological fields such as the chromosomal organisation of gene expression. We have analysed three bacteria, B. Subtilis, E. Coli and S. Meliloti and have revealed long-range correlations of expression in all organisms, whatever the gene studied.
Abstract FR:
Les mesures des niveaux d'expression d'un génome entier requièrent une analyse statistique afin d'obtenir des conclusions fiables. Les biologistes ont du mal à se retrouver dans la foule de méthodes existantes et les comparaisons actuellement employées reposent sur des critères lacunaires ou non biologiques. L'organisation du génome bactérien permet la définition d'un critère de comparaison à pertinence biologique indépendante de la problématique : les opérons. Une comparaison de méthodes classiques grâce à ce critère a été appliquée sur des méthodes classiques. Par ailleurs les méta-analyses de transcriptome sont en train de se développer malgré les biais inhérents à cette technologie. Elles ouvrent la possibilité d'étudier de nouveaux champs en biologie comme l'organisation chromosomique de l'expression des gènes. L'étude de trois bactéries, B. Subtilis, E. Coli et S. Meliloti a révélé des corrélations d'expression à longue distance (environ 600kb) quel que soit le gène étudié.