Deuxième semestre

Méthodes de rééchantillonnage

Objectifs

Mobiliser ses connaissances de probabilité et de statistiques inférentielles pour la définition d’une méthode de rééchantillonnage adaptée à l’inférence considérée
Mettre en œuvre une méthode de rééchantillonnage
Lire et discuter un texte scientifique utilisant des méthodes de rééchantillonnage à des fins statistiques.

Plan

L’inférence statistique repose généralement sur la connaissance des distributions de probabilités des statistiques. Si la loi d’une statistique est inconnue, une méthode de rééchantillonnage cherche à approcher par simulation de Monte Carlo cette distribution conditionnellement aux données observées. Le principe de cette technique est de substituer à la loi de probabilité inconnue une distribution empirique construite à partir de l’échantillon d’apprentissage.
L’objectif de ce cours est de présenter les principales méthodes de rééchantillonnage : les tests par permutations, la validation croisée, le jackknife, le bootstrap. Le cours alternera description des procédures, preuves mathématiques, exercices et études de cas pratiques. Le cours portera essentiellement sur des modèles statistiques indépendant et identiquement distribués. En fonction du temps, nous verrons des extensions du Bootstrap appliquées par exemple aux modèles hétéroscedastiques (Wild Bootstrap), aux données dépendantes (Block Bootstrap, Subsampling) ou massives (Bag of Little Bootstrap).
1.Tests par permutations
2.La validation croisée et le jackknife
3.Le Bootstrap d’Efron
4. Cas pathologiques et dépendance temporelle
Une liste d’exercices non corrigés est fournie pour permettre aux étudiants de s’exercer en supplément des cours

Prérequis

probabilité, statistique inférentielle, régression, apprentissage supervisé, séries temporelles, calcul bayésien