thesis

Sanitizing microdata without leak : a decentralized approach

Defense date:

Jan. 1, 2011

Edit

Disciplines:

Authors:

Directors:

Abstract EN:

The frontiers between humans and the digital world are tightening. An unprecedented and rapidly increasing amount of individual data ends up nowadays into well-structured and consistent databases. Privacy-preserving data publishing models and algorithms are an attempt for benefiting collectively from this wealth of data while still preserving the privacy of individuals. However, few works have focused on their implementation issues, leading to highly vulnerable practical scenarios. This thesis tackles precisely this issue, benefiting from the rise of portable, large capacity, and tamper-resistant devices used as personal data servers. Its contribution is a set of correct and secure protocols permitting to perform traditional non-interactive privacy-preserving data publishing algorithms and models in an original context where each individual manages her data autonomously through her own secure personal data server.

Abstract FR:

Le monde digital imprègne de plus en plus fortement le quotidien de chacun. Croissant rapidement, la quantité de données personnelles se retrouvant stockées dans des bases de données cohérentes et bien structurées atteint des niveaux inégalés. L'anonymisation de données (privacy-preserving data publishing - ou PPDP) est une tentative pour bénéficier de cette richesse tout en protégeant l'intimité des individus. Cependant, peu de travaux se sont penchés sur la mise en œuvre sécurisée des techniques d'anonymisation : les processus d'anonymisation mis en place en pratique souffrent de vulnérabilités préoccupantes. Dans cette thèse, nous nous intéressons précisément à ce problème, et proposons de tirer partie de l'émergence d'un nouveau type de dispositif sécurisé, portable, et à large capacité de stockage. La contribution de cette thèse est un ensemble de protocoles, corrects et sécurisés, capables de réaliser une large variété de modèles et algorithmes d'anonymisation non-interactifs, et ce dans un contexte original où chaque individu gère lui-même ses données personnelles à l'aide de son propre serveur de données sécurisé.