Affinement de requêtes posées à un médiateur : au sein du système PICSEL
Institution:
Paris 11Disciplines:
Directors:
Abstract EN:
In recent years, the problem of information integration has received a lot of attention. In particular, several information integration systems have been based on a mediator architecture which provides a uniform query interface to multiple and possibly heterogeneous data sources which enables users to focus on specifying their demand, by freeing them from having to find the relevant sources and possibly combine data from multiple sources to obtain answers. In the setting of data integration systems, the need for a cooperative query answering process is especially crucial because users do not know the contents of the data sources that are available. In particular, it may happen that the user's query has no answer because it violates the domain or its translation leads to specialised query plans that violate the constraints specifying the actual contents of the sources. In this case, it is important to explain to the user why his query failed and to propose close queries that can have answers. In this thesis we take a logical framework for representing the domain model and the source description, associated with inference algorithms. First we characterise the minimal causes of the absence of any answer. Second we build a set of repairs, such that each repair has a common generalisation with the initial query or we generate predefined queries, starting from the sources description and we present a method to calculate similarity between two predicates and then between two queries.
Abstract FR:
Le nombre croissant de données accessibles via des réseaux intranet ou via Internet pose le problème de l'intégration de sources autonomes d'information préexistantes, souvent distantes et hétérogènes, afin de faciliter leur interrogation par un large public. Les travaux présentés ici suivent l'approche médiateur car elle présente l'intérêt de pouvoir construire un système d'interrogation de sources de données sans gérer les données et en intégrant éventuellement de nouvelles sources, au fur et à mesure. Ils ont été effectués dans le cadre du projet Picsel développé au LRI, qui est actuellement le seul système médiateur intégrant un module d'affinement de requêtes. En effet, l'une des attentes primordiales de celui qui interroge une source d'information est de recevoir, non pas simplement la réponse directe à sa question, mais une réponse qui satisfait ses besoins implicites et explicites d'information. Ainsi, lorsqu'une question ne peut avoir de réponses, on ne se contente pas de le faire savoir à celui qui l'a posée, mais on lui explique pourquoi et on lui propose des réponses alternatives. Dans cette thèse, nous nous intéressons aux requêtes posées à un médiateur, qui n'obtiennent pas de réponse. Ce cas survient fréquemment lorsque l'utilisateur ne maitrise pas le domaine d'application et pose une requête violant les connaissances du domaine, ou lorsqu'il ne connaît pas les limites de compétences des différentes sources disponibles pour le médiateur. Notre travail consiste à proposer à l'utilisateur une requête qui apporte des réponses et qui reste sémantiquement proche de sa requête initiale. Nous montrons tout au long du manuscrit en quoi le choix d'une approche médiateur a pu motiver les différentes contributions que nous apportons pour aider l'utilisateur.