thesis

Distribution de logiciels libres dans un environnement pair-à-pair

Defense date:

Jan. 1, 2008

Edit

Institution:

Paris, CNAM

Disciplines:

Authors:

Directors:

Abstract EN:

The aim of this research work is to improve the mechanisms for distributing open-source software among the developers and users communities. We designed a novel system for content dissemination, based on a peer-to-peer (P2P) architecture, providing a large panel of functionalities such as publishing content, subscription and notification mechanisms, querying and content downloading. We propose a structured model for content, annotated with metadata, on which we build a complex information system with advanced capabilities for resource location. The decentralized approach inherent to a P2P structure, combined with a rich model for content description, create together the premises for a scalable and flexible system, where all the peers in the network (publishers, mirrors or clients) are involved in the distribution process. Our solution comes to face a real necessity in open-source software development and offers a replacement alternative to the current distribution mechanisms. We integrated several existing subsystems (a distributed index for metadata management and a dissemination platform based on content clustering and multicast) into a complex system that transparently provides to the user all the content management functionalities. Our implementation took the shape of an industrial prototype, evaluated on a large scale network deployment and ready to be adopted by Mandriva Linux community.

Abstract FR:

L'objectif des travaux de recherche présentés dans cette thèse est l'optimisation des mécanismes de distribution de logiciels libres auprès de la communauté des développeurs et utilisateurs. Nous avons conçu un nouveau système de diffusion de contenu à grande échelle, fondé sur une architecture pair-à-pair (P2P), offrant des fonctionnalités telles que la publication de contenu, des mécanismes d'abonnement et de notification, l'indexation et l'interrogation des métadonnées et le téléchargement de contenu. Nous proposons un modèle de données structuré, annoté avec des métadonnées, sur lequel s'appuie un système avancé de gestion de contenu. L'architecture du système est décentralisée et tous les pairs (publieurs, miroirs ou clients) participent au processus de distribution. Notre solution répond à un besoin spécifique dans la gestion des gros logiciels libres et offre une alternative plus flexible et qui passe à l'échelle comparée aux mécanismes de diffusion actuels. L'implémentation logicielle s'appuie sur l'intégration de plusieurs sous-systèmes existants (un index distribué pour la gestion des métadonnées et une plate-forme de diffusion basée sur du clustering de contenu et multicast) dans un système global, qui propose d'une manière transparente pour l'utilisateur toutes les fonctionnalités de distribution de contenu. La réalisation du système s'est concrétisée dans un prototype qui a été évalué dans un déploiement expérimental pour la diffusion du logiciel Mandriva Linux.