Analyse et conception au sein d'IMGT® d'une approche bioinformatique intégrée pour l'identification et la description des gènes d'immunoglobulines et de récepteurs T de locus génomiques de grandes tailles
Institution:
Montpellier 2Disciplines:
Directors:
Abstract EN:
The antigen receptors, immunoglobulins (IG) and T cell receptors (TR), are important molecular components of the adaptive immune response of vertebrates. The locus of IG and TR consist of variable (V), diversity (D), joining (J) and constant (C) genes. Chain synthesis requires IG and TR rearrangements of V and J, or V, D and J genes in DNA, and transcript splicing of rearranged V-J and V-D-J genes to C genes. Because of the characteristics of the IG and TR genes, associated with these mechanisms, conventional bioinformatic software are not adapted to their annotation in large genomic sequences. To meet the need of the biocurators working at IMGT®, the international ImMunoGeneTics information system®, I developed IMGT/LIGMotif a tool for gene annotation of IG and TR. This tool is based on standardized rules defined in IMGT-ONTOLOGY, the first ontology in immunogenetics and immunoinformatics. IMGT/LIGMotif currently provides annotation of V, D and J gene clusters in human and mouse large genomic sequences. The annotation process includes several modules that allow the description of genes by assigning labels, the gene orientation in the analysed sequence and the identification of their functionality. IMGT/LIGMotif analyses sequences extending up to 2. 5 megabase pairs and can analyse locus batch file sequences. IMGT/LIGMotif is particularly useful for annotating genomic sequences of human and mouse loci (new haplotypes) and those of closely related species, the non-human primates and rat respectively.
Abstract FR:
Les récepteurs d'antigènes, immunoglobulines (IG) et récepteurs T (TR), sont des composants moléculaires important de la réponse immunitaire adaptative des vertébrés. Les locus d'IG et TR sont constitués des gènes variables (V), de diversité (D), de jonction (J) et constants (C). La synthèse des chaînes IG et TR exige des réarrangements des gènes V et J, ou V, D et J, au niveau de l'ADN et l'épissage des gènes réarrangés V-J et V-D-J aux gènes C. A cause des particularités des gènes d'IG et TR rattachées à ces mécanismes, les logiciels bioinformatiques conventionnels ne sont pas adaptés à leur annotation dans de grandes séquences génomiques. Pour répondre au besoin des biocurateurs-annotateurs d'IMGT®, the international ImMunoGeneTics information system®, j'ai développé IMGT/LIGMotif, un outil pour l'annotation des gènes d'IG et TR. Cet outil est fondé sur les règles standardisées définies dans IMGT-ONTOLOGY, la première ontologie en immunogénétique et immunoinformatique. IMGT/LIGMotif annote actuellement les gènes V, D et J de l'homme et de la souris, dans de grandes séquences génomiques. Le processus d'annotation intègre plusieurs modules qui permettent la description des gènes en leur attribuant des labels, leur orientation dans la séquence analysée et l'identification de leur fonctionnalité. IMGT/LIGMotif analyse actuellement des séquences allant jusqu'à 2. 5 paires de mégabases et peut analyser des locus par lot de fichiers de séquences. IMGT/LIGMotif est particulièrement utile pour annoter les séquences génomiques de locus d'homme ou de souris (nouveaux haplotypes) et ceux d'espèces proches, respectivement, les primates non-humains et le rat.