thesis

Muninn, une stratégie d'extraction d'informations dans des corpus spécialisés par application de méthodes d'analyse linguistique de surface et de représentation conceptuelle des structures sémantiques

Defense date:

Jan. 1, 2001

Edit

Institution:

Dijon

Disciplines:

Authors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Les travaux décrits dans ce mémoire de thèse présentent le résultat de la réflexion que nous avons menée sur la mise au point d'un système efficace d'extraction d'informations dans des corpus spécialisés. De manière à positionner le problème dans le cadre d'une application réelle, et pour valider les choix technologiques qui ont été faits, les travaux présentés ici ont été réalisés en collaboration avec des biologistes. Les techniques mises au point ont été appliquées à la résolution du problème de l'extraction d'informations sur des interactions génétiques dans des textes traitant de la mouche Drosophile. La contribution principale de ce travail de recherche porte sur la mise au point d'une architecture originale pour effectuer de l'extraction d'informations dans les textes en utilisant des techniques d'analyse linguistique de surface associées à une représentation conceptuelle des structures sémantiques des phrases. La contribution porte aussi sur la résolution d'une série de problèmes spécifiques apparaissant au cours de la cascade des traitements comme par exemple la reconnaissance automatique des noms de gènes de la Drosophile, ou alors la normalisation automatique des phrases. Le système mis au point a été évalué sur des corpus validés au préalable par des experts. Les résultats obtenus comparés à ceux d'autres méthodes se sont révélés très intéressants et ont permis de valider l'approche.