thesis

Étude de la formalisation des spécifications de bases de données géographiques en vue de leur intégration

Defense date:

Jan. 1, 2005

Edit

Disciplines:

Authors:

Abstract EN:

Integrating them into a federated database system, by describing the precise data meaning in a way both homogeneous between databases and as formal as possible. This precise data meaning is contained in the databases’ content specifications (surveying rules). Method : The general organization of the present specifications follows that of the databases’ schemata, but these schemas are heterogeneous and influenced by implementation problems. To overcome this problem, we suppose that it will be possible to find, in the specifications’ text, a number of common terms referring to shared geographical concepts. All these concepts would constitute what is called a domain ontology. Our idea is not to create a complete ontology but rather a partial, ad hoc one, which would be extended to take new concepts into account as needed. The specifications would then be represented as a bundle of what we call representation procedures, which describe how, given a geographic entity (instance of some geographical concept), one or more representations of this entity are built up into the different databases depending on the nature and the properties of the entity. Thus these procedures describe the links between the ontology and the schemata of the databases. Results : For the example of hydrography in two different IGN databases, BDCarto and BDTopo, our hypothesis seems confirmed : a common ontology could rather easily be defined. Concerning the representation procedures, we were able to establish the main kinds of elementary rules from which they can be constructed. To describe formally these procedures, we then defined a formal language whose grammar has been described in BNF and is based on these elementary rules. Finally, we have made a software prototype, containing a parser for this language, for entering, saving and handling the formal specifications

Abstract FR:

Objectif : faciliter l’utilisation conjointe de plusieurs bases de données géographiques, et en particulier leur intégration dans un système de bases de données fédérées, grâce à une description homogène entre les différentes bases et autant que possible formelle de la sémantique précise des données, c’est-à-dire des spécifications de contenu. Méthode : Les spécifications papier ont le défaut d’être structurées conformément aux schémas des bases de données, qui sont hétérogènes et influencés par des choix d’implémentation. Pour s’affranchir de ce problème, on fait l’hypothèse qu’on peut trouver dans les spécifications un certain nombre de termes consensuels correspondant à des concepts géographiques partagés. Ces concepts formeraient ce qu’on appelle une ontologie du domaine. L’idée n’est pas de créer cette ontologie de façon exhaustive mais de créer une ontologie partielle ad hoc, qu’on étendra au fur et à mesure qu’on rencontrera de nouveaux concepts dans les spécifications. Les spécifications sont alors représentées sous la forme de procédures de représentation qui à une entit géographique (instance d’un concept donné) associent une ou plusieurs représentations dans les différentes bases, en fonction de la nature et des propriétés de l’entité ; elles font donc le lien entre l’ontologie et les schémas des différentes bases. Résultats : sur les thèmes hydrographie de la BDCarto et de la BDTopo, deux bases de données de l’IGN, il semble que l’hypothèse soit vérifiée (on arrive assez facilement à une ontologie commune). On a pu d’autre part déterminer les principaux types de règles élémentaires nécessaires à la construction des procédures de représentation. Un langage formel dont la grammaire, définie en BNF, s’appuie sur ces règles élémentaires a alors été proposé pour décrire les procédures de représentation. Enfin, un prototype logiciel muni d’un parseur pour ce langage a été réalisé pour saisir, stocker et manipuler les spécifications formelle