Protocole d'appel de multiprocedure à distance dans le système GOTHIC : définition et mise en oeuvre
Institution:
Rennes 1Disciplines:
Directors:
Abstract EN:
Pas de résumé disponible.
Abstract FR:
Les travaux décrits dans ce document s'inscrivent dans le projet Inria/Bull GOTHIC, développé à l'Irisa ayant pour ambition la réalisation d'un système distribué résistant aux pannes sur un réseau local de machines multiprocesseurs. L'originalité de l'architecture de GOTHIC réside dans l'association d'une mémoire particulière appelée mémoire stable rapide à chaque processeur. D'un point de vue langage, polygloth, le langage de GOTHIC, offre le concept de multiprocédure, généralisation de la procédure qui est étudiée comme outil de structuration des systèmes distribués. Nos travaux ont consister à définir les protocoles adaptés à l'appel de multiprocédure à distance, à les vérifier et à les mettre en oeuvre dans le cadre de GOTHIC. Dans la première partie de ce mémoire, nous présenterons les nombreux travaux consacrés ces dernières années à l'étude et à la mise en oeuvre de protocoles de communication fiable dans les systèmes distribués : protocoles d'appel de procédure à distance, protocole de diffusion fiable et protocoles qui généralisent l'appel de procédure à distance en permettant l'exécution de la procédure appelée sur plusieurs sites en parallèle. Le protocole d'appel de multiprocédure à distance, appelé protocole RMPC, que nous avons développé dans le cadre du système GOTHIC est présenté dans la deuxième partie. La troisième partie est consacrée à la description des protocoles de communication fiable (communication fiable par message, diffusion atomique et diffusion atomique ordonnée) que nous avons mis en oeuvre dans le système GOTHIC et sur lesquels s'appuie le protocole RMPC. L'originalité de ces protocoles tient à l'utilisation de mémoires stables rapides d'une part pour ranger les données du système de communication et d'autre part pour conserver des points de reprise des processus communiquant. Le fonctionnement correct de ces protocoles en présence de pannes est justifié. En conclusion de cette partie, nous passons en revue les solutions apportées à quelques points délicats de mise en oeuvre et donnons une analyse détaillée des performances mesurée.