Apprentissage statistique
- Enseignant(s)
- Catherine KERVIZIC, Clément ELVIRA, Fabien NAVARRO, Hervé BUANNIC, Isabelle ZAIM, Jacqueline QUEMERAIS, Laurence BACONNAIS, Patricia OLLIVIER, Sébastien DA VEIGA, Sylvie HOGUET, Thomas ROUCH
- Type de matière
- STATISTIQUE
- Correspondant
- Sébastien DA VEIGA
- Module
-
SDDP - UE1 Machine Learning
- Nombre d'ECTS
- 2.5
- Code matière
- SDDP-STD - 23
- Répartition des enseignements
-
Heures de cours : 18
- Langue d'enseignement
- Français
Objectifs
Comprendre les différents modèles de l’état de l’art (modèle linéaire : régression et classification, pénalisation, méthodes locales, SVM, forêt) ; Connaître les cas d’usage de ces modèles ; Savoir comparer empiriquement différents modèles pour une tâche donnée ; Savoir implémenter les méthodes étudiées en Python ou R
Plan
Apprentissage supervisé ; Régression ; Classification ; Minimisation du risque empirique ; Évaluation des modèles ; Validation croisée ; Approximation fonctionnelle ; Complexité des modèles ; Optimisation à grande échelle ; Descente de gradient stochastique ; Régularisation ; RIDGE et LASSO ; Machine à vecteur de support ; Astuce du noyau ; Méthodes d’ensemble ; Agrégation et Boosting ; Forêt aléatoire.
Prérequis
Régression, régression logistique, convergence de lois de probabilité, théorème central-limite, algèbre linéaire, classification par arbre, programmation avec R, programmation orientée objet, optimisation : maximisation d’une fonction, algorithme de Newton