Analyse d’une consultation citoyenne par NLP : « Comment agir ensemble dès maintenant pour l’environnement ? »

« Actuellement, les propositions des consultations sont classées par des humains via des tags. Cependant, au vu du nombre important de propositions faites par consultation, cette approche présente le désavantage d’être coûteuse en temps, en argent et peut être victime de l’erreur humaine. L’objectif de notre projet est de modéliser les thématiques citoyennes issues de cette consultation en appliquant des approches de NLP et d’apprentissage non-supervisé.

Notre tutrice dans le cadre de ce projet statistique a déjà travaillé sur cette problématique avec Make.org en tant que data scientist indépendante et nous a donné comme mission de trouver des approches innovantes en étant force de proposition.

Pour cela, dans un premier temps nous effectuerons une analyse descriptive de nos données afin de mieux les appréhender ainsi que le pré-traitement nécessaire pour les exploiter, ensuite nous étudierons différentes méthodes pour transformer des données textuelles en données numériques afin de pouvoir mettre en place des algorithmes de classification non supervisée et enfin nous analyserons nos résultats finaux. »