En novembre 2020 s’est tenue la Cinquième conférence sur la traduction automatique (WMT20) . Colocalisé avec le REMLP 2020, l’événement s’est tenu en ligne et a accueilli un certain nombre de tâches de traduction courantes sur divers aspects de la traduction automatique. Chaque année, les plus grands acteurs du secteur se réunissent au WMT pour accomplir un certain nombre de tâches de traduction courantes et discuter de leurs travaux. Au final, les résultats sont comparés et évalués, ce qui permet aux participants de partager leur savoir-faire et leurs meilleures pratiques, mais aussi d’évaluer où se situe leur système dans le domaine de la TA et de la linguistique informatique.

Cette année, l’équipe d’eTranslation a pris part à la traduction des actualités et a partagé la tâche1

avec cinq paires de langues différentes : de l’anglais vers l’allemand, le tchèque et le polonais d’une part, et du japonais et du russe vers l’anglais d’autre part. L’inclusion de deux langues non européennes a clairement souligné la mission d’eTranslation d’étendre sa couverture linguistique, et les résultats ont montré que le système de traduction automatique de la Commission européenne est sur une voie très prometteuse :

  • eTranslation a atteint le haut du classement lors des évaluations par score BLEU automatique.
  • Dans les évaluations menées par l’homme, eTranslation se trouvait généralement dans le groupe le mieux classé (groupe de moteurs uniquement séparés par les marges d’erreur attendues).
  • Classé 2e pour les traductions en polonais.
  • Pour le russe vers l’anglais, la traduction automatique d’eTranslation a donné de meilleurs résultats que la traduction humaine  utilisée à des fins de comparaison.
  • Classé 3e pour la combinaison anglais vers allemand dans le test de robustesse des systèmes de TA.

Ces résultats montrent qu’eTranslation peut se mesurer aux meilleurs acteurs du secteur tout en fournissant à l’équipe des informations utiles pour poursuivre sur la lancée de ce succès. L’article correspondant sur le portail numérique du CEF2 s

résume bien les principaux messages à retirer de l’expérience : « Bien que la parité avec les traductions humaines ne soit pas encore atteinte, l’amélioration constante dans ce domaine signifie que la traduction automatique a un impact de plus en plus substantiel sur le champs de la traduction, à la fois en tant qu’outil pour les traducteurs humains et en tant qu’alternative lorsque l’exactitude certifiée et le style parfait ne sont pas requis ».

Le prochain WMT fera l’objet d’une grande opportunité et d’un défi passionnant pour eTranslation et l’ensemble du monde de la recherche : ELRC et LT-Bridge organiseront conjointement une tâche commune pour la traduction multilingue du patrimoine culturel couvrant deux familles de langues européennes : les langues romanes et scandinaves. Restez informés et suivez-nous via Twitter, LinkedIn et Facebook !

Vous trouverez des informations supplémentaires sur le service en cliquant sur le lien suivant : https://ec.europa.eu/cefdigital/wiki/display/CEFDIGITAL/eTranslation.