thesis

Accès aux bases de données géographiques en langage naturel : application aux descriptions d'itinéraire

Defense date:

Jan. 1, 2001

Edit

Institution:

Paris 11

Disciplines:

Authors:

Directors:

Abstract EN:

The aim of these studies is to allow to use the information of the geographical databases in order to process the route descriptions in Natural Language, i. E. In order to understand them and to retrieve the equivalent objects in the database, and, conversely to product descriptions from routes processed by Geographical Information Systems. Correlating information contained by the database and by texts in Natural Language is difficult mainly because of the numerous possibilities of nature of the information. Indeed, while, in a database, the information is organized according to a predefined format and with a numerical representation, it is represented by linguistic constituents, varying according to their choice, their designation, and their organization for one subject to another. After studies of several works about route descriptions, we present ontology associated to route descriptions within several environments. From the formal framework furnished by these ontologies, we defined a pivot system, allowing to mask the geographical database organization, by expressing it with attributes and relations defined in the domain ontology. This system allows to translate a concept representing a landmark to the set of the database objects which can represent it, and conversely, from an object to the landmark that it represents. When interpreting the description, this system is used as a base for the reasoning model which must not only identify used landmarks, but also the prescribed actions, taking into account the context, i. E. The current position of the agent, the perceptual limitations, human imprecisions and ambiguities. We also describe application examples, by retailing in particular the syntactic and semantic analysis and tools necessary to them.

Abstract FR:

L'objectif des travaux exposés dans cette thèse est de permettre l'utilisation des informations contenues dans une base de données géographiques afin de traiter des descriptions d'itinéraires en langage naturel, c'est-à-dire aussi bien de les comprendre et de retrouver leurs équivalents en terme d'objets de la base de données, que de les produire à partir d'itinéraires calculés par des Systèmes d'Informations Géographiques. La mise en corrélation des informations de la base de données et des textes en langage naturel se heurte à de nombreuses difficultés, et en premier lieu, à la différence de nature de ces informations. En effet, si dans une base de données les informations sont organisées suivant un format prédéfini et représentées le plus souvent de façon numérique, elles sont représentées dans les textes par des éléments linguistiques variant dans leur choix, leur désignation et leur organisation d'un sujet à un autre. Après l'étude de différents travaux traitant des descriptions d'itinéraire, nous avons donc étudié l'ontologie associée à ces descriptions pour différents environnements et défini un système Pivot permettant de masquer l'organisation de la base de données géographiques, en l'exprimant en fonction des attributs et relations définis dans l'ontologie du domaine. Ce système permet de passer d'un concept représentant un type de repère à l'ensemble des objets de la base qui peuvent le représenter, et inversement, d'un objet au repère qu'il représente. Lors de l'interprétation d'une description, le système sert de base au modèle de raisonnement qui doit non seulement identifier les repères utilisés, mais aussi les actions prescrites, tout en tenant compte du contexte, c'est à dire de la position courante de l'agent et les limites de sa perception, des imprécisions et des ambigui͏̈tés. Nous décrivons également des exemples d'application, en détaillant en particulier les analyses syntaxiques et sémantiques des textes, et les outils nécessaires à celles-ci.