La révolution date de 2015, mais les applications en ligne ne l’ont intégrée qu’à partir de l’an dernier. L’exploitation des réseaux de neurones artificiels (deep learning) proposée par l’Université de Montréal a, en effet, permis aux traducteurs automatiques de faire un bond qualitatif considérable. Souvenez-vous: lors d’un test que nous avions fait en novembre 2015, le plus célèbre d’entre eux – Google – traduisait:
⇨ texte à traduire:
Ich wollte, dass sich unsere Schüler einbringen, ihre Ideen beisteuern und sich gleichzeitig nicht nur für die Geschichte von Genf, sondern auf für dessen Zukunft interessieren.
⇨ traduction humaine:
Je voulais que nos élèves s’impliquent, amènent leurs idées et, simultanément, s’intéressent non seulement à l’histoire de Genève mais aussi à son avenir.
⇨ Google Traduction (2015):
Je voulais apporter ce que nos étudiants à leurs idées et qui sont intéressés dans le même temps, non seulement pour l’histoire de Genève, mais pour son avenir.
Quel charabia! Et pourtant, c’était une des meilleures propositions parmi les 12 traducteurs que nous avions mis à l’épreuve!
Aujourd’hui, le même Google propose:
⇨ Google Traduction (2018):
Je voulais que nos étudiants s’impliquent, apportent leurs idées, et ne se soucient pas seulement de l’histoire de Genève, mais aussi de leur avenir.
Il y a certes toujours une grosse erreur: le texte original fait référence à l’avenir de Genève, pas à celui des élèves. Mais c’est tout de même nettement mieux!
«Il faut accepter certaines limites, explique Andrei Popescu-Belis (photo), professeur à la HEIG-VD d’Yverdon et spécialiste du traitement automatique des langues: le programme ne comprend pas le sens de la phrase. Ce n’est qu’un processus mécanique et statistique qui donne pourtant des résultats d’assez bonne qualité, surtout dans les langues et les domaines les plus demandés.»
Problème de pronom
Les progrès sont donc notables, mais les traducteurs commettent encore des erreurs grossières.
Exemple tout simple. En anglais, le pronom personnel à la troisième personne du pluriel est «they», qu’il soit masculin ou féminin. Plaçons-le dans l’exemple:
⇨ texte à traduire:
Many persons eat too much. Then they will grow fat.
⇨ traduction humaine:
De nombreuses personnes mangent trop. Elles vont donc grossir.
Sur les cinq traducteurs retenus pour la comparaison (lire encadré), quatre ont traduit «they» par «ils», parce qu’ils ne sont pas allés chercher la cible (les personnes) dans la phrase précédente. Un seul a fait juste, mais propose:
⇨ traduction en ligne:
Alors elles se développeront grosses...
«Pour le pronom, peut-être a-t-il simplement eu de la chance, commente Andrei Popescu-Belis: finalement, il n’y a qu’un risque sur deux de se tromper!»
Les connecteurs
Autre problème récurrent: les connecteurs entre deux phases, qui ont souvent plusieurs sens. Ainsi plaçons «since» dans
⇨ texte à traduire:
I had a lot of fun since I arrived.
⇨ traduction humaine:
Je me suis beaucoup amusé dès mon arrivée.
Quatre traducteurs proposent
⇨ traduction en ligne:
Je me suis beaucoup amusé depuis mon arrivée.
C’est une bonne traduction. Le dernier, en revanche, choisit la mauvaise option et traduit
⇨ traduction en ligne:
J’ai eu beaucoup d’amusement puisque je suis arrivé.
Aller au-delà de la phrase
«L’idée, poursuit Andrei Popescu-Belis, est donc de pousser le programme à ne pas s’arrêter à la phrase délimitée par un point, mais à aller chercher dans celles qui précèdent les informations nécessaires pour replacer le mot à traduire dans son contexte. Cela nécessite, évidemment, une puissance de calcul qui n’était pas disponible il y a dix ans.»
A cet effet, son équipe de recherche a développé une technique de «post-correction» avec des résultats encourageants. Dans des couples de langues comme français-anglais ou espagnol-anglais, où les pronoms induisent les traducteurs en erreur dans 50% des cas, elle permet de ramener le taux à 30%. Il est donc vraisemblable que, dans les années à venir, les programmes s’améliorent encore, mais sans viser à atteindre la précision et la fluidité d’une traduction humaine.
Christian Chevrolet
Lire le bonus web: De l'allemand au français
Comparatif
DeepL et Google sortent du lot
Parmi les nombreux traducteurs en ligne, nous en avons retenu cinq, souvent considérés comme les meilleurs pour le couple de langues anglais-français.
Il suffit de glisser le texte à traduire, par exemple avec un copier-coller, dans la case réservée à la langue source (ils l’identifient tous automatiquement, sauf Systran), de préciser la langue cible et la proposition suit souvent en moins d’une seconde.
Le plus récent programme, DeepL, bénéficie des ressources de Linguee, un dictionnaire original qui exploite des millions de traductions «humaines» publiées sur la toile (Parlement européen, administration fédérale, etc.). Il s’est donc rapidement imposé comme l’un des traducteurs automatiques les plus performants et permet, en cliquant sur n’importe quel mot du texte proposé, d’afficher des variantes et des exemples d’intégration précieux provenant de traductions humaines.
Mais Google Translate ne s’est pas endormi sur ses lauriers. Il a, lui aussi, pris le virage du «deep learning» et mérite, sans conteste, la médaille d’argent de notre petit comparatif. Il est possible de suggérer des modifications dans le texte traduit, censées améliorer l’outil à long
terme.
Pas de médaille de bronze en revanche. Les trois autres traducteurs souffrent, en effet, de lacunes très différentes (en allemand surtout) qui ne nous permettent pas de les distinguer.
Petit test de l’anglais au français*
Texte à traduire More and more groceries and health food stores stock gluten-free products. That’s good news for people with celiac disease, who for health reasons should not eat wheat with gluten.
Traduction humaine Un nombre croissant d’épiceries et de magasins de produits diététiques proposent des aliments dépourvus de gluten. C’est une bonne nouvelle pour les personnes atteintes de la maladie coeliaque qui, pour des raisons de santé, ne devraient pas consommer du blé contenant du gluten.
DeepL De plus en plus d’épiceries et de magasins d’aliments naturels vendent des produits sans gluten. C’est une bonne nouvelle pour les personnes atteintes de la maladie coeliaque qui, pour des raisons de santé, ne devraient pas manger du blé avec du gluten.
⇨ DeepL livre une traduction presque sans faute. Il n’a simplement pas transposé les «aliments naturels» en «produits diététiques», mais tous ses concurrents font de même. Autre problème récurrent: le blé «avec» du gluten pourrait être mal compris et il est donc préférable d’écrire du blé «contenant» du gluten.
Google De plus en plus d’épiceries et de magasins d’aliments naturels stockent des produits sans gluten. C’est une bonne nouvelle pour les personnes atteintes de la maladie coeliaque qui, pour des raisons de santé, ne devraient pas manger du blé avec du gluten.
⇨ Google est un peu plus lourd en restant collé au texte anglais et se trompe en préférant le verbe «stocker» à «vendre» ou – mieux encore – à «proposer», puisqu’il est déjà précisé que nous sommes dans un commerce.
Bing De plus en plus d’épiceries et d’aliments naturels stockent des produits sans gluten. C’est une bonne nouvelle pour les personnes atteintes de la maladie cœliaque, qui pour des raisons de santé ne devraient pas manger de blé avec du gluten.
⇨ Bing (traducteur de Microsoft) fait de même et oublie les «magasins», ce qui rend la première phrase peu compréhensible. Il fait aussi l’impasse sur les deux virgules avant et après «pour des raisons de santé», ce qui n’est pas très important.
Systran De plus en plus les épiceries et les magasins de nourriture biologique stockent les produits gluten-gratuits. C’est de bonnes actualités pour des personnes avec la maladie coeliaque, qui pour des raisons de santé ne devrait pas manger du blé avec du gluten.
⇨ Systran traduit malheureusement «free» par «gratuit» au lieu de «sans», ainsi que «That’s good news» par «C’est de bonne actualité». Il cumule, par ailleurs, des problèmes de forme.
Yandex De plus en plus et les épiceries et les magasins d’aliments santé du stock de produits sans gluten. C’est une bonne nouvelle pour les personnes atteintes de la maladie coeliaque, qui pour des raisons de santé ne devraient pas manger de blé avec du gluten.
⇨ Yandex (le Google russe) se plante complètement dans la première phrase, incompréhensible.