thesis

Analyse et prediction des contacts entre les chaines laterales des proteines

Defense date:

Jan. 1, 1999

Edit

Institution:

Paris 7

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Le but de cette these est d'analyser les contacts entre les chaines laterales des proteines, et de predire les principales zones de contact a partir de la connaissance de la sequence, facilitant ainsi la construction de modeles proteiques. Ce travail debute par une analyse des contacts au sein de proteines non redondantes. Le role primordial de l'accessibilite au solvant sur les contacts est mis en evidence, et les contributions des differents types de contacts entre acides amines sont quantifies, ainsi que leurs tendances a etre dans un contact entre deux structures secondaires donnees ou a etre accessible au solvant. Nous proposons un nouveau potentiel de force moyenne excluant la composante non negligeable due a l'enfouissement des residus. Par ailleurs, nous avons defini les tendances particulieres des residus a s'associer aux autres, ce qui a permis de classifier les acides amines en classes de comportements de contacts. Du fait du role primordial de l'accessibilite, il nous a semble ensuite naturel de predire cette accessibilite en fonction de la sequence et d'autres parametres globaux propres aux proteines. Nous demontrons que la prediction de l'accessibilite est un probleme quasiment monofactoriel, c'est-a-dire dependant uniquement de deux vecteurs de contributions, l'un lie au type d'acide amine, et l'autre a la position des residus dans l'environnement sequentiel. A partir des resultats precedents, nous proposons une methode de prediction des zones de contacts, basee sur un apprentissage des contacts et de leurs environnements sequentiels et incorporant divers facteurs tels que l'environnement sequentiel, la distance sequentielle et l'accessibilite au solvant du contact. Trois exemples de cartes de contacts sont donnes pour des proteines ayant des compositions en structures secondaires tres differentes : les pourcentages de contacts retrouves, de non contacts retrouves, et de points correctement predits, sont respectivement de l'ordre de 50%, 75% et 70%. Ces resultats sont encourageant et ouvrent des perspectives interessantes pour la suite du travail.