thesis

Méthodes d'accès décentralisées pour la recherche par le contenu dans les environnements distribués dynamiques

Defense date:

Jan. 1, 2010

Edit

Institution:

Paris 6

Disciplines:

Authors:

Directors:

Abstract EN:

Pas de résumé disponible.

Abstract FR:

Le but de cette thèse est de contribuer au développement de nouvelles techniques de recherche de données basée sur le contenu, utilisables dans un environnement de type pair-àpair (P2P), sans ressource partagée. En particulier, nous nous concentrons sur la résolution, pour des données multidimensionelles, de trois types de requêtes importants : les requêtes par intervalles, les requêtes de similarité et les requêtes skyline. La structure de données la plus couramment employée dans le domaine est du type table de hachage distribuée (DHT). Toutefois le hachage impose un enregistrement sur la base d’une valeur unique de clé. De plus, il détruit la localité des données. La destruction de la localité compromet le traitement efficace des requêtes portant sur des données corrélées, ce qui est le cas des types de requêtes qui nous intéressent. Or, de ce pouvoir d’interrogation dépend la possibilité pour l’utilisateur de découvrir des données. Afin de répondre aux limitations de l’existant, nous proposons dans cette thèse une solution complète d’indexation et de localisation décentralisées de données multidimensionnelles : PosNet. Dans le cadre de nos contributions, nous proposons une structure de données multidimensionnelle originale, nommée pograph, préservant un ordre sur le clés. Cet ordre nous permet de définir une famille d’algorithmes de recherche permettant d’élaguer l’espace de recherche, tout en fonctionnant dans un pograph distribué. Il en résulte que PosNet permet de résoudre de manière décentralisée et sans jointure les requêtes exactes, avec joker, par intervalles, de similarité et skyline. Un prototype, pyPosNet, est disponible publiquement sous une licence libre.