Espaces vectoriels sémantiques : enrichissement et interprétation de requêtes dans un système d'information distribué et hétérogène
Institution:
NantesDisciplines:
Directors:
Abstract EN:
Information systems face a relevance problem in retrieval due to the huge increase of avalaible data. Moreover, the number of networking devices grows up and jeopardizes the client/server architecture model. A new architecture is the emerging : peer-to-peer networks (P2P). But they are greedy in network ressources (queries flood the network) and offer limited functionalities (key word search). In both fields, IR and P2P systems, research are going deeper on the use of semantics. In computer science, semantics based approaches generally relies on the definition of ontologies. Huge and distributed development of ontologies leads to a semantic heterogeneity. A classical solution relies on the use of mappings between parts of two ontologies. But this solution is difficult to obtain and not always complete. Unshared parts of two ontologies are often not managed, which leads to a loss of information. Our solution, ExSI2D, uses a special query expansion, called structuring expansion, on query initiator's side. Then she can specify the dimensions of her query without any modification of the query itself. Information provider is also allowed to interpret the structuring expansion within her own ontologies. Thus each participant of a semantic heterogeneous information system is able to use all her ontology, including the unshared parts. We also present a solution to the use of ExSI2D in a P2P system, thanks to SPARTANBFS, a « frugal » protocol for unstructured P2P systems.
Abstract FR:
Les systèmes d'information font face à un problème de pertinence dans les recherches dû à l'augmentation considérable des données accessibles. De plus, le nombre d'appareils communicants ne cesse de croître et de menacer le modèle client/serveur. Une nouvelle architecture distribuée tend donc à s'imposer : les réseaux pair-à-pair (P2P). Mais ils sont peu économes en ressource réseau (une requête inonde le réseau) et offrent des fonctionnalités limitées (recherche par mot-clés). Dans les deux communautés, RI et systèmes P2P, les recherches penchent vers l'utilisation de sémantique. En informatique, les approches basées sur la sémantique nécessitent souvent de définir des ontologies. Le développement important et distribué des ontologies génère une hétérogénéité sémantique. La solution classique est d'utiliser des correspondances entre parties de deux ontologies. Mais c'est une solution qui est difficile à obtenir et qui n'est pas toujours complète. Souvent les parties non-partagées de deux ontologies ne sont pas gérées, ce qui entraîne une perte d'information. Notre solution : ExSI2 D, utilise une expansion particulière, appelée expansion structurante, du côté de l'initiateur de requêtes. Cela lui permet de préciser les dimensions de sa requête sans modifier la requête elle-même. ExSI2D offre aussi la possibilité au fournisseur d'information d'interpréter l'expansion structurante dans sa propre ontologie. Ainsi, il est possible à chaque participant d'un système d'information sémantiquement hétérogène d'utiliser toute son ontologie y compris les parties non partagées. Nous montrons aussi l'utilisation d'ExSI2D dans un système P2P, grâce à SPARTANBFS, un protocole « frugal » pous systemes P2P non structurés.