Premier semestre

Nouvelles sources de données

Objectifs

– Connaissance d’un panel de nouvelles sources de données mobilisables pour la statistique publique
– Introduction à des méthodes et outils nécessaires à l’exploitation de nouvelles sources de données
– Travail de bibliographie et de regard critique sur une thématique permettant de mieux découvrir les apports et limites de certaines sources

Plan

La multiplication de nouveaux types de données collectées par des acteurs privés ou par les administrations représente un défi pour la statistique publique. Quelles sont ces sources de données ? Quels sont les domaines où celles-ci peuvent satisfaire certains critères de qualité et de représentativité tout en apportant une information complémentaire aux données administratives ou d’enquêtes ? Quelles sont les innovations informatiques récentes rendant possible l’exploitation de ces données ?

Dans ce cours, on présentera différentes sources de données nouvellement exploitées par l’Insee et la statistique publique en général, comme les données de téléphonie mobile, de comptes bancaires ou de transactions CB (angle Big Data), les images satellites, les données textuelles, ainsi que plusieurs exemples de données issues d’Internet (Twitter et réseaux sociaux, Se Loger, etc. qui peuvent être obtenues par webscraping ou via des API). On verra dans quel but ces données peuvent être mobilisées pour la statistique publique et quels outils et méthodes sont mobilisables pour les exploiter.

Prérequis

Non indiqué