thesis

Interprétation automatique d'itinéraires dans des récits de voyages. : D'une information géographique du syntagme à une information géographique du discours.

Defense date:

Jan. 1, 2008

Edit

Institution:

Pau

Disciplines:

Authors:

Abstract EN:

The contribution of this PhD belongs to the domain of Natural Language Processing, Information Extraction, Information Retrieval and Cognitive Science in a context of Geomatics. In this context, our contribution aims at automatically processing texts telling travel stories to interpret the geographical information they contain and more particularly the itineraries they describe. The approach we propose is an incremental method to discover the semantics of the document : starting from semantics of a simple nominal syntagm level - through proposition level semantics- we reach discourse level semantics. Schematically, we first interpret the evocation of geographical places, then the travels of the narrator and eventually, from this travel sequence, we interpret the itinerary. Our contribution lies in the proposition of a task driven conceptual model (for IR and the conception of educational activities), the proposition of an approach to characterise the itinerary in the text and the proposition of an operating process to link the characterization of the itinerary in the text with its conceptual model. Our approach is clearly an experimental one, that is why we rely our works on a prototype that we developed. This prototype (PIIR for Prototype pour l'Interprétation d'Itinéraires dans des Récits) allows us to confront our analyses and algorithms with automatic aimed treatment. We also assessed the results of our automated treatments in order to underline the problems that are still unresolved after our PhD contribution, as indeed they o_er interesting perspective examined in the last chapter of this PhD.

Abstract FR:

Cette thèse se place à la croisée du traitement automatique du langage, de l'extraction d'information, de la recherche d'information et des sciences cognitives, dans un contexte de géomatique. Dans ce contexte, nos travaux visent à traiter automatiquement des textes relatant des récits de voyage, avec pour objectif d'interpréter l'information géographique qu'ils contiennent et plus particulièrement les itinéraires qu'ils décrivent. L'approche que nous proposons est une méthode incrémentale de découverte du sens : partant d'une sémantique du niveau du syntagme nominal simple, et passant par une sémantique du niveau de la proposition, nous atteignons une sémantique du niveau du texte. Très schématiquement, notre parcours dans la découverte du sens est donc le suivant : interprétation des évocations de lieux, interprétation des déplacements du narrateur basée sur les verbes de déplacement et le critère de polarité aspectuelle spatiale qui leur est attaché, et enfin interprétation de cette séquence de déplacements pour construire l'itinéraire. Notre contribution réside donc dans la proposition d'un modèle du concept d'itinéraire adapté à des usages ciblés (pour la RI et pour des usages de conception d'activités pédagogiques), la proposition d'une approche pour caractériser l'itinéraire dans le texte, et enfin la proposition d'un mode opératoire automatisé et entièrement implémenté permettant de relier la caractérisation de l'itinéraire dans le texte à son modèle du concept. Notre démarche étant clairement expérimentale, nous nous sommes appuyé tout au long de nos travaux sur un prototype que nous avons mis au point. Ce prototype (PIIR pour Prototype pour l'Interprétation d'Itinéraires dans des Récits) nous permet de mettre face au traitement automatique les analyses et les algorithmes que nous proposons. Nous avons également évalué les résultats de nos traitements automatisés afin de pointer les problèmes qui restent en suspens après ces travaux de thèse. Ces problèmes ouvrent des perspectives intéressantes que nous avons discutées en fin de mémoire.