Sensemaking.fr
Première en France : un manuel de deep learning traduit par l’IA

Julie Rousseau

Un outil d’intelligence artificielle a été spécialement conçu par une startup française pour traduire en français un manuel technique de deep learning.

L’apprentissage profond, tel est le titre de la version française (publiée le 2 septembre 2018 par Massot Editions et Quantmetry) d’un best-seller en anglais sur le deep learning, « un type d’intelligence artificielle dérivé du machine learning (apprentissage automatique) où la machine est capable d’apprendre par elle-même, contrairement à la programmation où elle se contente d’exécuter à la lettre des règles prédéterminées » (1).
 
Faire vivre, à l’heure des data, une sensibilité française
 
C’est la startup française Quantmetry, en partenariat avec DeepL qui a traduit ce livre écrit par trois chercheurs en intelligence artificielle (IA), dont l’un des pères fondateurs des réseaux de neurones profonds, Yoshua Bengio. Mais attention, pas n’importe comment : la traduction des 800 pages que compte l’ouvrage a été réalisée intégralement par une intelligence artificielle (IA).

« C’est une première ! », se félicite Jérémy Harroch, PDG et fondateur de Quantmetry, start-up française spécialisée dans la mise en place de solutions d’IA pour les grands groupes. « Ce livre paru en novembre 2016 s’est imposé en référence du deep learning. Nous avons voulu qu’il soit diffusé dans le monde francophone. Car il ne faut pas se leurrer, le Français reste la langue des affaires en France. Autant que ce soit aussi la langue des mathématiques », prône ce diplômé de Polytechnique longtemps expatrié aux États-Unis. Et d’ajouter : « C’est aussi important pour faire vivre, à l’ère de la data, une sensibilité française, voire européenne, qui se manifeste notamment dans la protection des données personnelles. » (2)
 
Un défi économique transformé en défi technique
 
Il aurait été trop cher et trop long de faire traduire ce livre par des chercheurs. L’éditeur a donc transformé le défi économique en un défi technique et s’est tourné vers l’IA, à savoir le moteur de traduction de la start-up allemande DeepL, qui s’est récemment imposée dans la traduction grâce au deep learning.

Quatre chercheurs français experts du deep learning ont mis au point un outil permettant à DeepL de traiter un texte technique de ce genre. Pour l’essentiel, cet outil est un lexique des termes mathématiques de la discipline, intégrant nuances et contextes. Il a aussi la capacité de traiter les textes et les figures en LaTeX — un langage et un système de composition de documents reposant sur une collection de macro-commandes destinées à faciliter l’utilisation du processeur de texte TeX de Donald Knuth (3).
 
Résultat, selon Alexandre Stora, responsable de l’accélérateur de start-up de Quantmetry : « Une traduction excellente, avec très peu d’erreurs, à laquelle nous avons essentiellement ajouté quelques notes pour s’adapter aux spécificités françaises de la discipline. », après seulement deux mois de relecture par les quatre chercheurs et les équipes de Quantmetry. La publication de cette version française aura coûté environ 30 000 euros à Quantmetry. « Avec une traduction humaine, cela aurait coûté plus de 100 000 euros et pris plus d’un an », compare Alexandre Stora.
 
Un algorithme est inapte à la création
 
Faut-il s’inquiéter de cette irruption de l’IA dans l’édition ? Pas forcément, selon Alexandre Stora, qui relève que « sans l’IA, l’équation économique aurait été très difficile pour ce type de livre qui se vend au mieux à quelques milliers d’exemplaires ». Or, « il aurait fallu que des scientifiques consacrent au moins une année au travail de traduction ! » Autrement dit, sans l’IA, la version française n’aurait pas vu le jour. Quantmetry prévoit d’ailleurs de mettre son outil à disposition de tous pour faciliter les traductions d’articles de recherche ou de thèses, traductions aujourd’hui inexistantes.
 
Un tel outil de l’IA permettrait-il de traduire aussi des œuvres littéraires ? Assurément non, selon Alexandre Stora : « La traduction par une IA n’a de sens que pour ce genre de documents techniques. Dans le cas d’un ouvrage littéraire, la traduction reste un travail d’interprétation, presque artistique, pour lequel l’humain reste indispensable. » Un algorithme est inapte à la création, même s’il peut générer des images originales comme celle de la couverture du livre, une image réalisée avec l’algorithme Deep Dream de Google.
 
(1) https://www.futura-sciences.com/tech/definitions/intelligence-artificielle-deep-learning-17262/
(2) https://www.usinenouvelle.com/editorial/le-premier-livre-traduit-par-une-ia-est-un-manuel-de-deep-learning.N740664
(3) https://openclassrooms.com/fr/courses/1617396-redigez-des-documents-de-qualite-avec-latex/1617565-quest-ce-que-latex