Soutenance de thèse d’Amandine Dubois

Amandine Dubois soutiendra sa thèse de doctorat « Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale » le lundi 21 juin à 9h à l’ENSAI. 

Ecole Doctorale : Mathématiques et Sciences et Technologies de l’Information et de la Communication

Unité de recherche : CREST (UMR 9194)

Directeur de thèse : Adrien SAUMARD, Enseignant-Chercheur, CREST- ENSAI

Co-directrice de thèse : Cristina BUTUCEA, Professeur, CREST-ENSAE, IP Paris

 

Rapporteurs avant soutenance

Béatrice LAURENT-BONNEAU : Professeur, INSA Toulouse

Aad VAN DER VAART : Professeur, Leiden University

 

Composition du jury

NomQualitéEtablissementRôle
BLANCHARD GillesProfesseurUniversité Paris-SaclayExaminateur
BUTUCEA CristinaProfesseurCREST-ENSAE, IP ParisCo-directrice de thèse
CARPENTIER AlexandraProfesseurMagdeburg UniversityExaminateur
DELYON BernardProfesseurUniversité de Rennes 1Examinateur
LAURENT-BONNEAU BéatriceProfesseurINSA ToulouseExaminateur
SAUMARD AdrienEnseignant-chercheurCREST-ENSAIDirecteur de thèse
VAN DER VAART AadProfesseurLeiden UniversityExaminateur
VERZELEN NicolasChercheurINRAE MontpellierExaminateur

Mots clés

confidentialité différentielle locale, estimation d’une densité, identification du support, tests d’adéquation, transition de phase, vitesses minimax

Problèmes d’estimation, de sélection de variables et de tests sous contraintes de confidentialité différentielle locale

Résumé : La notion de confidentialité différentielle a été introduite pour permettre de réaliser des analyses statistiques tout en fournissant des garanties de protection des données personnelles analysées. Dans cette thèse, on s’intéresse à trois problèmes d’inférence statistique sous contraintes de confidentialité différentielle locale. Dans un premier temps, on s’intéresse à l’estimation non-paramétrique d’une densité de probabilité. Nous étudions le risque minimax sur les ellipsoïdes de Besov, et nous intéressons à la question de l’adaptation au paramètre de régularité. On s’intéresse ensuite à l’identification du support de l’espérance d’une variable aléatoire suivant une loi normale d-dimensionnelle. Sous des hypothèses de sparsité, nous étudions le risque minimax lié à la distance de Hamming, et en déduisons des conditions nécessaires et suffisantes pour que l’identification du support soit possible. Enfin, nous étudions un problème de test d’adéquation pour des densités Höldériennes dont le support n’est pas supposé borné. Pour chaque problème, nous mettons en évidence l’influence des contraintes de confidentialité sur les vitesses minimax.

Abstract: The notion of differential privacy has been introduced to enable statistical analyses to be carried out while protecting the privacy of the individuals whose data are analysed. In this thesis, three problems of statistical inference under local differential privacy constraints are considered. First, we address the problem of nonparametric density estimation. We study the minimax risk over Besov ellipsoids under the Lr-risk, and we investigate adaptation to the regularity parameter. We then consider the problem of identifying the support of the expectation of a d-dimensional gaussian random variable. Under sparsity assumptions, we study the minimax risk for the Hamming loss, and obtain necessary and sufficient conditions for support recovery to be possible. Finally, we address a goodness-of-fit testing problem for Hölder continuous densities. For each problem, we quantify how the local differential privacy constraints affect the classical minimax rates.