thesis

Modèle de mélange sur la variance pour l'analyse différentielle des biopuces

Defense date:

Jan. 1, 2005

Edit

Disciplines:

Authors:

Abstract EN:

The recent development of high throughput technologies in the life science industry and molecular biology has prompted major advances in the fields of statistics and data analysis. We propose a novel method, named VarMixt, for the tasks of variance estimation and differential analysis of DNA microarrays. This method is elaborated upon an original mixture model on the distribution of the gene variance. The issues of parameters estimation and model selection are addressed. The performance of our method is assessed with large simulation studies. A diversity of real world applications illustrates its relevance and its impact in addressing real biological problems. Some ideas are mentioned to extend our mixture model to linear mixed models that can take into account complex correlation structures.

Abstract FR:

L'industrialisation de la production de données en biologie moléculaire a fait naître des besoins spécifiques en termes de méthodes statistique. Nous avons mis au point une nouvelle approche, baptisée VarMixt, pour résoudre les questions d'estimation de la variance et d'analyse différentielle des données de biopuces. Cette méthode est construite en modélisant la distribution des estimateurs de la variance par un modèle de mélange. Nous traitons des aspects d'estimation des paramètres et de sélection de modèle. Une étude empirique par simulation fournit des résultats concernant la robustesse et les performances de notre méthode, alors qu'une variété d'applications illustre sa pertinence dans des cas concrets. Une ouverture est aussi proposée vers des modèles mixtes, couplés à des modèles de mélanges, pour rendre compte de structures de corrélations plus complexes parfois présentes dans les données (variabilité technique/ variabilité biologique).