Im November 2020 fand die Fifth Conference on Machine Translation (Fünfte Konferenz über maschinelle Übersetzung) (WMT20) statt. Die Veranstaltung, die zeitgleich mit EMNLP 2020 stattfand, wurde online abgehalten und beinhaltete eine Reihe von gemeinsamen Übersetzungsaufgaben zu verschiedenen Aspekten der maschinellen Übersetzung. Jedes Jahr treffen sich die wichtigsten Akteure der Branche auf der WMT, um eine Reihe gemeinsamer Übersetzungsaufgaben zu erledigen und ihre Vorgehensweise zu diskutieren. Am Ende werden die Ergebnisse verglichen und ausgewertet. So können die Teilnehmer ihr Know-how und ihre Best Practices austauschen, aber auch einschätzen, wo ihr System im Bereich der MT und Computerlinguistik steht.

In diesem Jahr nahm das eTranslation-Team mit fünf verschiedenen Sprachpaaren an der gemeinsamen Aufgabe der Nachrichtenübersetzung1

teil: Englisch zu Deutsch, Tschechisch und Polnisch auf der einen Seite und Japanisch und Russisch zu Englisch auf der anderen Seite. Die Aufnahme von zwei Nicht-EU-Sprachen verdeutlichte die Mission von eTranslation, seine Sprachunterstützung zu erweitern. Die Ergebnisse zeigten, dass das maschinelle Übersetzungssystem der Europäischen Kommission auf einem vielversprechenden Weg ist:

  • eTranslation erreichte Spitzenpositionen in der Rangliste nach automatischem BLEU-Score.
  • Bei der Bewertung durch Menschen befand sich eTranslation in der Regel in dem am besten bewerteten Cluster (Gruppe von Suchmaschinen, die nur durch erwartete Fehlermargen getrennt sind).
  • Rang 2nd für Übersetzungen ins Polnische.
  • Für Russisch zu Englisch lieferte eTranslation bessere Ergebnisse als die zum Vergleich herangezogene menschliche Übersetzung .
  • Rang 3rd für Englisch zu Deutsch im Test auf Robustheit von MT-Systemen.

Diese Ergebnisse zeigen, dass eTranslation mit den Besten in diesem Bereich mithalten kann und dem Team darüber hinaus nützliche Erkenntnisse liefert, um diesen Erfolg weiter auszubauen. Der entsprechende Artikel auf dem CEF Digital Portal2

fasst die Kernaussagen schön zusammen: „Obwohl die Parität mit menschlichen Übersetzungen noch nicht erreicht ist, bedeutet die stetige Verbesserung auf diesem Gebiet, dass die maschinelle Übersetzung einen immer größeren Einfluss auf den Bereich der Übersetzunghat, sowohl als Werkzeug für menschliche Übersetzer als auch als Alternative , wenn zertifizierte Genauigkeit und perfekter Stil nicht erforderlich sind“.

Die nächste WMT wird eine große Chance und eine spannende Herausforderung für eTranslation und die gesamte Forschungswelt mit sich bringen: ELRC und LT-Bridge werden gemeinsam eine geteilte Aufgabe zu Multilingual Cultural Heritage Translation (Mehrsprachige Übersetzung des kulturellen Erbes) organisieren, die zwei europäische Sprachfamilien abdeckt: Romanische und skandinavische Sprachen. Bleiben Sie dran und folgen Sie uns über Twitter, LinkedIn und Facebook!

Weitere Informationen über eTranslation finden Sie hier: https://ec.europa.eu/cefdigital/wiki/display/CEFDIGITAL/eTranslation.