thesis

Nouvelles méthodologies protéomiques d’aide à l’annotation des génomes et à la validation des séquences protéiques

Defense date:

Jan. 1, 2009

Edit

Institution:

Strasbourg

Disciplines:

Abstract EN:

During last years, proteomic analysis by mass spectrometry has considerably progressed thanks to technological developments to become the reference method for protein study. Today, the areas of application of proteomics are very wide and among them a new field is emerging : the proteogenomics in which proteomics is used directly as a tool to aid in genome annotation. The main objective of this PhD thesis was to develop new proteogenomic approaches based on proteomic methodologies to improve the quality of protein sequence databases available to the scientific community. To reach this goal, we have developed : 1. A new strategy to improve the identification of N-terminal peptides (N-TOP strategy) in order to facilitate the identification of protein start codons which is probably one of the greatest challenges of genome annotation. 2. Optimized MS/MS search strategies in sequence databanks (genome or protein) in order to facilitate the detection of errors in protein databases generated by bioinformatic prediction. These strategies have been successfully applied in various studies to improve protein database reliability. The N-TOP strategy has also opened up outlook in two important proteomic fields : characterization of protein phosphorylation and quantitative proteomics.

Abstract FR:

Ces dernières années, l’analyse protéomique par spectrométrie de masse a considérablement progressé grâce à des développements technologiques jusqu’à devenir la méthode de choix pour l’étude des protéines. Les domaines d’application de la protéomique sont aujourd’hui très vastes et parmi ceux-ci un nouveau domaine est en pleine émergence : la protéogénomique dans laquelle la protéomique sert directement d’outil d’aide à l’annotation génomique. L’objectif principal de ce travail de thèse était de développer de nouvelles approches de protéogénomique basées sur les méthodologies de la protéomique pour améliorer la qualité des banques de séquences protéiques disponibles pour la communauté scientifique. Pour atteindre cet objectif, nous avons notamment développé : 1-Une nouvelle stratégie pour améliorer la détermination des peptides N-terminaux des protéines (stratégie N-TOP) afin de faciliter l’identification des codons d’initiation des protéines qui représente sans doute un des plus grands défis de l’annotation génomique. 2-Des stratégies optimisées de recherche de données MS/MS dans les banques de séquences (génomiques ou protéiques) pour faciliter la mise en évidence d’erreurs dans les banques protéiques générées par prédiction in silico. Ces stratégies ont pu être appliquées avec succès dans le cadre de différentes études en permettant d’améliorer la qualité des banques protéiques La stratégie N-TOP a également ouvert d’autres perspectives dans deux grands champs très important de la protéomique : la caractérisation des phosphorylations des protéines et la protéomique quantitative.