Premier semestre

Publication de données respectueuse de la vie privée

Objectifs

« Les données personnelles sont le nouveau pétrole d’Internet et la nouvelle monnaie du monde numérique » a déclaré M. Kouneva, commissaire européen à la protection des consommateurs en mars 2009. La valeur de l’analyse massive des données personnelles pour les industriels, les scientifiques et la société en général est largement reconnue aujourd’hui. Cependant, leur caractère personnel et potentiellement sensible est un obstacle majeur à leur partage à grande échelle. L’objectif des modèles et algorithmes de publication de données respectueuse de la vie privée est précisément d’offrir des garanties fortes de respect de la vie privée tout en autorisant un partage de qualité à des fins d’analyse. La tâche est loin d’être triviale comme l’ont démontré plusieurs scandales de ré-identification. L’objectif de ce cours est de présenter aux étudiants les principaux paradigmes et techniques de publication de données respectueuse de la vie privée.

L’accent sera particulièrement mis sur un modèle proéminent aujourd’hui : la differential privacy.

Plan

Présentations par divers intervenants extérieurs. Ces présentations vont exposer les problématiques et solutions de traitement et de publication de données individuelle dans leur cadre industriel.

Prérequis

Connaissances de base en gestion de données, en algorithmique, et en probabilités et statistiques & Compétences de base dans un langage de programmation parmi Java, Python, ou R.