thesis

Analyse de processus stochastiques pour la génomique : étude du modèle MTD et inférence de réseaux bayésiens dynamiques

Defense date:

Jan. 1, 2007

Edit

Institution:

Evry-Val d'Essonne

Disciplines:

Authors:

Directors:

Abstract EN:

This thesis deals with DNA sequence and time series gene expression analysis. First we study the parsimonious Markov model called Mixture Transition Distribution (MTD) model and introduce an EM algorithm for MTD models estimation. Then we propose two approaches for genetic network recovering using Dynamic Bayesian Networks (DBNs). The dependencies are described by a directed graph whose topology has to be inferred despite the overly low number of repeated measurements compared with the number of observed genes. First we assume that the topology is constant across time, we approximate this graph by considering partial order dependencies and we develop a deterministic procedure for DBNs inference. Then we consider a multiple changepoint regression model defining a succession of homogeneous phases. The changepoints location and the structure within each phase are simultaneously inferred thanks to a reversible jump MCMC procedure.

Abstract FR:

Cette thèse porte sur l'analyse de séquences d'ADN et de données temporelles d'expression de gènes. Nous étudions tout d'abord un modèle parcimonieux de mélange de transition markoviennes (MTD) et introduisons un algorithme EM pour son estimation. Nous présentons ensuite deux approches pour la reconstruction de réseaux génétiques utilisant des réseaux bayésiens dynamiques (DBN). Les dépendances sont décrites par un graphe orienté dont on cherche à estimer la topologie malgré le très faible nombre de mesures par rapport au nombre de gènes observés. Nous supposons d'abord une topologie fixe au cours du temps, approchons ce graphe en considérant des dépendances d'ordre partiel et développons une procédure déterministe d'inférence de DBN. Nous considérons ensuite un modèle de régression à ruptures multiples définissant une suite de phases homogènes. La position des points de rupture et la structure de chaque phase sont estimés simultanément grâce à une procédure MCMC à sauts réversibles.