Soutenance de thèse d’Amandine Dubois
Amandine Dubois soutiendra sa thèse de doctorat « Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale » le lundi 21 juin à 9h à l’ENSAI.
Ecole Doctorale : Mathématiques et Sciences et Technologies de l’Information et de la Communication
Unité de recherche : CREST (UMR 9194)
Directeur de thèse : Adrien SAUMARD, Enseignant-Chercheur, CREST- ENSAI
Co-directrice de thèse : Cristina BUTUCEA, Professeur, CREST-ENSAE, IP Paris
Rapporteurs avant soutenance
Béatrice LAURENT-BONNEAU : Professeur, INSA Toulouse
Aad VAN DER VAART : Professeur, Leiden University
Composition du jury
Nom | Qualité | Etablissement | Rôle |
---|---|---|---|
BLANCHARD Gilles | Professeur | Université Paris-Saclay | Examinateur |
BUTUCEA Cristina | Professeur | CREST-ENSAE, IP Paris | Co-directrice de thèse |
CARPENTIER Alexandra | Professeur | Magdeburg University | Examinateur |
DELYON Bernard | Professeur | Université de Rennes 1 | Examinateur |
LAURENT-BONNEAU Béatrice | Professeur | INSA Toulouse | Examinateur |
SAUMARD Adrien | Enseignant-chercheur | CREST-ENSAI | Directeur de thèse |
VAN DER VAART Aad | Professeur | Leiden University | Examinateur |
VERZELEN Nicolas | Chercheur | INRAE Montpellier | Examinateur |
Mots clés
confidentialité différentielle locale, estimation d’une densité, identification du support, tests d’adéquation, transition de phase, vitesses minimax
Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale
Résumé : La notion de confidentialité différentielle a été introduite pour permettre de réaliser des analyses statistiques tout en fournissant des garanties de protection des données personnelles analysées. Dans cette thèse, on s’intéresse à trois problèmes d’inférence statistique sous contraintes de confidentialité différentielle locale. Dans un premier temps, on s’intéresse à l’estimation non-paramétrique d’une densité de probabilité. Nous étudions le risque minimax sur les ellipsoïdes de Besov, et nous intéressons à la question de l’adaptation au paramètre de régularité. On s’intéresse ensuite à l’identification du support de l’espérance d’une variable aléatoire suivant une loi normale d-dimensionnelle. Sous des hypothèses de sparsité, nous étudions le risque minimax lié à la distance de Hamming, et en déduisons des conditions nécessaires et suffisantes pour que l’identification du support soit possible. Enfin, nous étudions un problème de test d’adéquation pour des densités Höldériennes dont le support n’est pas supposé borné. Pour chaque problème, nous mettons en évidence l’influence des contraintes de confidentialité sur les vitesses minimax.
Abstract: The notion of differential privacy has been introduced to enable statistical analyses to be carried out while protecting the privacy of the individuals whose data are analysed. In this thesis, three problems of statistical inference under local differential privacy constraints are considered. First, we address the problem of nonparametric density estimation. We study the minimax risk over Besov ellipsoids under the Lr-risk, and we investigate adaptation to the regularity parameter. We then consider the problem of identifying the support of the expectation of a d-dimensional gaussian random variable. Under sparsity assumptions, we study the minimax risk for the Hamming loss, and obtain necessary and sufficient conditions for support recovery to be possible. Finally, we address a goodness-of-fit testing problem for Hölder continuous densities. For each problem, we quantify how the local differential privacy constraints affect the classical minimax rates.