Marie, un stage en Deep Learning pour la médecine personnalisée
Créer un modèle de prédiction pour une pathologie hépatique et adapter des méthodes de Deep Learning aux enjeux de la médecine personnalisée : telles ont été les deux missions de Marie Guyomard, ENSAI promo 2020, lors de son stage de fin d’études au sein du laboratoire I3S de Sophia-Antipolis.
Retour sur un stage de troisième année de cursus ingénieur particulièrement enrichissant, passeport pour un doctorat en intelligence artificielle dans le domaine de la médecine personnalisée.
En ligne de mire : la recherche en Data Science appliquée à la médecine personnalisée
Marie Guyomard : “Durant mes années de prépa ENS D2 au lycée Turgot à Paris, j’ai pris goût aux statistiques. C’est la raison pour laquelle j’ai intégré l’ENSAI. Mon attrait pour le domaine de la santé m’a motivée à suivre les cours de l’Université de Leiden au sein du Master Statistical Science for the Life and Behavioural Sciences pendant mon Erasmus en deuxième année.
La suite logique aurait alors été pour moi de poursuivre en dernière année en filière Biostatistique. Néanmoins, j’ai fait le choix d’intégrer la filière Génie Statistique, afin d’acquérir des méthodes de travail méthodologiques nécessaires pour faire carrière dans la recherche.
Les choix que j’ai effectués pendant ma scolarité à l’ENSAI ont toujours été motivés par l’envie de faire de la recherche dans le domaine de la médecine personnalisée.
Le principal enjeu de la médecine personnalisée est d’adapter un traitement en fonction du profil de chaque patient. À partir de ses caractéristiques biologiques et cliniques, il doit être possible de déterminer si un patient a développé une pathologie ou non, et si oui quelle en est la gravité. Cela permet alors de personnaliser son traitement pour une meilleure prise en charge.
Deep Learning pour la santé : prévenir et mieux traiter la NASH fibrosante
J’ai réalisé mon stage de fin d’études au sein du laboratoire I3S de Sophia-Antipolis (Laboratoire d’Informatique, Signaux et Systèmes de Sophia Antipolis) sur le sujet “Deep Learning pour la santé”.
Le laboratoire I3S a été créé en 1989 et est l’un des plus importants laboratoires de recherche en sciences de l’information et de la communication de la Côte d’Azur. Ma mission a été encadrée par Lionel Fillatre, enseignant-chercheur en Data Sciences. J’ai également étroitement collaboré avec Cyprien Gilet, doctorant en Machine Learning pour la médecine personnalisée.
L’équipe de Machine Learning du laboratoire I3S a établi une collaboration avec un hépatologue du CHU de Nice dont les recherches portent depuis plusieurs années sur la prédiction de la NASH fibrosante.
La NASH (Non-Alcoholic SteatoHepatitis) une pathologie souvent asymptomatique. Elle est caractérisée par une surcharge en graisse du foie, sans rapport avec l’alcool. En l’absence de prise en charge de ces patients, la progression de la maladie peut conduire à la cirrhose.
Un modèle de prédiction et l’adaptation du Deep Learning au service de la médecine
Les objectifs de mon stage étaient au nombre de deux.
Dans un premier temps, j’étais en charge d’établir un modèle de prédiction pour la NASH fibrosante, à partir de données cliniques, ne nécessitant pas de méthodes invasives (telle qu’une biopsie par exemple, à la fois lourde pour le patient et coûteuse pour le système hospitalier).
Dans un second temps, j’ai mené un travail de recherche sur le Deep Learning, pour adapter l’utilisation d’apprentissage profond par réseaux de neurones aux diverses problématiques rencontrées par les praticiens en médecine personnalisée.
Malgré la situation sanitaire pouvant compliquer l’avancement du travail, les visio-conférences hebdomadaires (via Zoom, Big Blue Button ou encore Tixeo) avec mes tuteurs de stage mais aussi des réunions à distance mensuelles avec le CHU de Nice, nous ont permis de remplir ces deux objectifs. En effet, les trois premiers mois de mon stage ont été réalisés en télétravail. J’ai pu intégrer les locaux du laboratoire début juillet.
Publication de deux articles et programmation d’un réseau de neurones
Durant mon stage, nous avons publié deux articles. Tout d’abord, nous avons réussi à présenter notre travail de prédiction pour la NASH fibrosante à Paris lors des 87e Journées Scientifiques de l’AFEF (Société Française d’Hépatologie) le 8 octobre dernier (« Diagnostic non invasif de la NASH fibrosante à l’aide de l’intelligence artificielle »). Pour ces modèles de prédiction de la NASH fibrosante, nous avons utilisé des méthodes étudiées à l’ENSAI pour la majeure partie.
De plus, j’ai eu la chance de pouvoir participer à l’élaboration d’un article théorique de Machine Learning pour la conférence Workshop on Uncertainty in Machine Learning (WUML) qui s’est tenue en Belgique le 18 septembre dernier.
L’article portait sur la méthode du Minimax, méthode que j’ai implémentée sous Python le premier mois de mon stage. Une modification a été ajoutée, de sorte à l’améliorer. En effet, une étape de discrétisation des variables par k-means a été implémentée initialement dans le Minimax, nous avons choisi de la réaliser à l’aide d’arbres de décision pour gagner en performance mais aussi en interprétabilité. J’ai pu réaliser la programmation de cette dernière ainsi que les différentes expériences présentes dans l’article “Adjusting decision trees for uncertain class proportions”.
Enfin, le travail de recherche sur le Deep Learning pour la médecine personnalisée n’est pas encore totalement abouti et nécessite des améliorations et des tests plus poussés. Néanmoins, les premiers résultats sont très encourageants.
Nous avons opté pour une méthode de pré-traitement des données médicales, une pratique très courante en médecine mais qui n’est pas encore automatisée. En d’autres termes, ce sont les médecins qui, à l’aide de leurs connaissances, déterminent ce pré-traitement des variables.
Afin d’automatiser ce processus, nous avons construit une architecture spécifique de réseau de neurones. Pour l’implémentation personnalisée de ce dernier, nous avons utilisé les librairies Pytorch sous Python. Du fait de son architecture particulière, nous ne pouvions pas utiliser les modules prédéfinis dans la librairie Pytorch. Ce travail m’a donc permis de prendre en main cette librairie et de développer mes compétences en programmation.
Une thèse à la suite du stage au sein du laboratoire I3S
Ce stage m’a beaucoup appris. Sur le plan personnel, la collaboration avec des médecins du CHU de Nice a été très enrichissante. Cela m’a permis de comprendre les besoins des médecins en Intelligence Artificielle. Il ne s’agit pas seulement de créer des modèles très performants, il faut aussi qu’ils soient facilement interprétables pour les médecins.
J’ai adoré découvrir le monde de la recherche et c’est la raison pour laquelle je poursuis actuellement en thèse. Au mois de mai, mon maître de stage m’a proposé de continuer à travailler avec lui encore trois ans en tant que doctorante.
Nous avons alors monté divers dossiers de candidature pour des bourses de thèse. Une semaine de mon stage a été entièrement consacrée à la préparation d’un oral de sélection. Grâce à ce travail nous avons obtenu une bourse de thèse de l’EUR DS4H (École Universitaire de Recherche Digital Systems for Humans).
Je vais donc mener une thèse sur le sujet « Apprentissage Minimax non-supervisé pour la médecine personnalisée : application aux patients Covid-19 », encadrée par Lionel Fillatre ainsi qu’un collaborateur du laboratoire IPMC (Institut de Pharmacologie Moléculaire et Cellulaire, Sophia-Antipolis).
En parallèle, nous allons continuer à travailler avec le CHU de Nice sur le travail de la NASH fibrosante puisque la collaboration a été très fructueuse pendant mon stage.
De plus, j’ai eu la chance d’être sélectionnée pour réaliser des missions d’enseignement tout au long de ma thèse. Je suis chargée de TD au sein de Polytech-Nice en Large-Scale Data, Programmation Orientée Objet en Java ainsi qu’en Data Valorization (Analyse Statistique des données) pour des étudiants de L3, M1 et M2.
Ce stage a été un vrai tremplin pour moi et m’a permis de me conforter dans le choix de devenir enseignante-chercheuse en Data Science pour la médecine personnalisée”.
Vous souhaitez devenir Data Scientist dans le domaine de la santé ? Plus d’informations sur le cursus ingénieur de l’ENSAI.