IA : première mondiale
Le livre référence Deep learning a été traduit par une intelligence artificielle. Salima El Kolei et Fabien Navarro, enseignants-chercheurs à l’ENSAI, ont participé à l’aventure.
Deep learning, c’est en quelque sorte la bible des étudiants, ingénieurs et chercheurs en intelligence artificielle (IA). Co-rédigé par Ian Goodfellow, Yoshua Bengio et Aaron Courville en 2016, l’ouvrage de 800 pages est devenu un best-seller scientifique. Convaincue qu’une traduction de l’ouvrage en français servirait la communauté francophone, la société Quantmetry, justement pionnière dans l’analyse de données et les applications tirées de l’IA, se heurte malheureusement à la question de la rentabilité : il faudrait vendre quelque 100 000 exemplaires de Deep learning pour absorber les coûts de traduction. Impasse. Une idée naît alors dans l’esprit des équipes de Quantmetry : traduire le livre grâce à un algorithme.
La start-up allemande et les chercheurs français
La drôle de mise en abyme – un ouvrage traitant d’IA traduit par une IA – a d’abord nécessité l’expertise de DeepL, une start-up allemande qui développe des systèmes d’IA et spécialisée dans le deep learning. DeepL a été créée par l’équipe à l’origine de plateforme de traduction Linguee, réputée pour sa performance. Son système a en effet été nourri à l’aide de corpus parfaitement traduits par des humains tels que des textes de lois internationaux et des romans et s’appuie sur des réseaux de neurones convolutifs entraînés à partir de la base de données Linguee. Cette approche neuronale de traduction automatique est ainsi en mesure de comprendre le contexte des mots et des phrases et de « produire du sens ». La solution idéale pour la traduction d’un ouvrage de 800 pages. Oui, mais Deep learning a été rédigé en LaTeX, un language dédié à la production de contenu scientifique que l’algorithme de DeepL ne sait pas traduire. Quantmetry a donc créé un outil spécialement dédié à cette tâche avec l’aide de quatre chercheurs français : Benjamin Guedj de l’INRIA, Christophe Chesneau de l’Université de Caen, Fabien Navarro et Salima El Kolei de l’ENSAI.
Aucune erreur
« Si les réseaux de neurones font appel à des outils mathématiques connus, nous n’avions pas de référence sur une telle application. C’était vraiment l’aventure. Nous avons donc réalisé un premier travail sur le glossaire afin de fixer la terminologie et le résultat s’est révélé très satisfaisant. Nous avons alors étendu et automatisé le travail à l’ouvrage tout entier » expliquent Fabien et Salima. Résultat ? L’algorithme n’a commis aucune erreur de sens, les formules mathématiques sont parfaitement traduites dans leur contexte. « Seules quelques corrections mineures ont été apportées au texte final » explique Nicolas Bousquet. Le directeur scientifique de Quantmetry entrevoit déjà les perspectives possibles, notamment pour les ouvrages très techniques dont la traduction par l’être humain n’est pas envisageable faute de rentabilité.
L’imagerie médicale aussi
Cette grande première, les deux statisticiens de l’ENSAI sont fiers d’y avoir participé. « Au-delà, l’apprentissage profond trouve des applications dans de nombreux autres domaines comme l’analyse d’images médicales » souligne Salima El Kolei. Responsable de la filière de spécialisation en Génie statistique, elle a d’ailleurs confié à ses élèves un projet de fin d’études portant sur la détection automatique de follicules à partir d’images de coupes d’ovaires de souris, obtenus par microscopie. Objectif : tenter de diminuer l’impact négatif de la chimiothérapie sur la fertilité des femmes à l’aide de l’apprentissage profond. Un projet mené là encore en collaboration étroite avec Quantmetry et les équipes de Nicolas Bousquet, et en partenariat avec l’INSERM. En perpétuelle évolution, la formation dispensée à l’ENSAI se nourrit ainsi de ces allers-retours entre la recherche académique et les applications dans l’économie et la société.
L’apprentissage profond
Ian Goodfellow, Yoshua Bengio et Aaron Courville
Une traduction française proposée par Quantmetry et les éditions Florent Massot, préfacée par Francis Bach