Premier semestre

Analyse spatiale

Objectifs

De plus en plus de données sont géolocalisées. L’ensemble des coordonnées géographiques des objets à traiter contient donc des informations potentiellement riches pour l’analyse. Que faire avec ces nouvelles sources de données ? Dans quels cas doit-on prendre en compte leur dimension spatiale ? Comment appliquer les méthodes de statistique et d’économétrie spatiale ?

Ce cours suit la démarche d’un analyste confronté à des données géolocalisées. A l’issue, les élèves sauront décrire et cartographier des données spatiales ; mesurer l’importance des effets spatiaux afin de juger de la nécessité de mettre en place une modélisation spécifique, et enfin choisir un modèle adapté aux données et aux objectifs de l’étude. Les zonages d’étude de l’Insee seront également présentés. L’ensemble des applications seront faites grâce au logiciel R.

Plan

Décrire les données géolocalisées :

– Analyse spatiale descriptive : prise en main des données avec le logiciel R, réalisation de premières cartes, notions de sémiologie cartographique.

– Codification de la structure de voisinage : présentation de différentes notions de voisinage, fondées sur la contiguïté ou les distances entre observations. Enjeux liés à une bonne définition.

– Les zonages d’étude de l’Insee : aires urbaines, unités urbaines, grille de densité, zones d’emploi : méthode de constitution, interprétation, usages. La version présentée sera celle de 2010, avec des éléments sur la mise à jour prévue en janvier 2020.

Mesurer l’importance des effets spatiaux :

Les données spatiales peuvent être réparties en trois catégories : surfaciques, ponctuelles, continues. A chaque catégorie correspondent un ensemble de méthodes d’analyse.

– Indices d’autocorrélation spatiale : ces indices permettent de mesurer la force des interactions spatiales entre les observations. Les versions locales et globales des indices seront présentées.

– Configurations de points : cette partie donnera les méthodes et les outils permettant notamment de mettre en évidence les éventuelles attractions ou répulsions entre les différents types de points, et la façon dont on évalue la significativité des résultats obtenus.

– Géostatistique : des notions sur la façon dont on peut modéliser une variable en des points où elle n’a pas été échantillonnée seront abordées ici.

Prendre en compte les effets spatiaux

– Econométrie spatiale : ces modèles prennent en compte la dépendance spatiale, c’est à dire les situations où la valeur d’une observation est liée aux valeurs des observations voisines.

– Lissage spatial : le lissage permet de faire apparaître des phénomènes spatiaux qui resteraient inobservés si l’on cartographiait uniquement les objets bruts.

– Régression géographiquement pondérée : ces modèles répondent au constat qu’une régression estimée sur l’ensemble d’un territoire d’intérêt peut ne pas appréhender de façon adéquate les variations locales. On peut notamment repérer où les coefficients locaux s’écartent le plus des coefficients globaux, et construire les tests permettant d’apprécier si et comment un phénomène est non stationnaire.

– Econométrie spatiale sur données d’enquête : ce module présentera les écueils liés à l’estimation d’un modèle d’économétrie spatiale sur données échantillonnées, et évaluera les potentielles corrections proposées par la littérature empirique

Prérequis

Non indiqué