thesis

Developpement de methodes basees sur les mathematiques, l'informatique et l'intelligence artificielle pour l'alignement de sequences et la prediction de structures proteiques

Defense date:

Jan. 1, 1994

Edit

Institution:

Paris 7

Disciplines:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Cette etude illustre les methodes d'analyse de sequences des proteines et elle introduit omega, une banque de donnees structurales de proteines ; hnh, une methode d'alignement et gasp une methode de prediction de structure secondaire. Omega est une compilation d'informations structurales de proteines portant sur toutes les structures de proteines publiees dans de journaux cites aux current contents mais non deposees aupres de la pdb. Avec l'entree de 5-10 nouvelles proteines toutes les semaines la version 2 de janvier 1994 contient 537 proteines. Cette base est disponible sur macintosh avec un logiciel d'interrogation que nous avons construit autour de 32 mots cles. La methode hnh (hydrophobic neighboring homology) introduit le concept d'hydrophobicite dans les methodes d'alignement. Nous ameliorons la recherche de similitudes entre les structures de proteines analysees en introduisant dans la methode de dotplot conventionnel le concept d'homologie d'hydrophobicite de voisins et les classes de degenerescence des acides amines (hydrophobes, hydrophiles et amphiphiles). La methode hnh peut comparer avec fiabilite des sequences de proteines presentant une identite de sequence inferieure a 20%. La methode gasp (genetic algorithm for secondary structure prediction) introduit les algorithmes genetiques une nouvelle approche d'intelligence artificielle et le concept d'hydrophobicite dans les methodes de prediction de structure secondaire de proteines. Le principe des algorithmes genetiques consiste a generer des populations de chromosomes (representations d'informations par un vecteur de bits) par crossing-over et mutations. Une fonction de fitness evalue l'adequation entre la structure secondaire modelisee et la sequence de motifs d'hydrophobicite observee, et permet de selectionner des solutions optimales