Analyse de la diversité génétique : mesures de dissimilarité et représentations arborées
Institution:
Montpellier 2Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Une structure arboree est une representation coherente d'un processus de diversification genetique. On s'interesse ici aux methodes de construction arboree a partir de mesures de dissimilarite, en particulier sous l'aspect de la stabilite. Apres une presentation theorique de l'ensemble des dissimilarites, on etudie les indices sur donnees binaires et leur comportement sous un modele d'erreur aleatoire. On montre que les caracteristiques biologiques des marqueurs moleculaires pemettent de choisir une dissimilarite qui minimise l'erreur liee a la perte d'information genetique. Dans une approche non-parametrique, on etudie les proprietes d'une distance ordinale basee sur le seul ordre des dissimilarites. On mesure le gain de precision des versions ordinales des algorithmes de regroupement par une procedure de comparaison par simulations. Les principes des methodes heuristiques de construction arboree sont rappeles et leurs proprietes face au probleme de stabilite, sont precisees. On presente une technique de greffage d'un individu supplementaire sur un arbre preetabli et une methode de regroupement sous contraintes de structure de sous-ensembles. On s'interesse ensuite a la construction d'arbres consensus, resumant les structures communes a plusieurs arbres. On propose un cadre formel de construction d'une distance entre arbres comme une distance sur le graphe de couverture du semi-treillis des distances additives. Pour etablir un test statistique, on etudie les distributions asymptotiques ou empiriques de diverses distances entre arbres. Ces methodes sont regroupees dans un logiciel qui est disponible.