-

En collaboration avec LT-Bridge, ELRC organise une tâche partagée WMT21 sur la traduction multilingue européenne à faibles ressources, qui se concentrera sur le multilinguisme dans le domaine du patrimoine culturel de deux familles linguistiques indo-européennes, c’est-à-dire le germanique nordique et le roman.

La traduction automatique massivement multilingue a fait preuve de capacités impressionnantes, y compris peu ou quelques traductions dans les langues à faibles ressources. Cependant, ces modèles sont souvent évalués (et entraînés) à partir de l’anglais ou vers l’anglais, langue dans laquelle la majorité des données sont disponibles, et supposant que ces modèles se généralisent en d’autres paires et langues à faibles ressources.

Notre tâche partagée sur la traduction multilingue à faibles ressources nous permettra d’explorer la manière dont les informations en une seule langue peuvent être transférées dans d’autres langues apparentées en évaluant la qualité des traductions dans des paires de langues à faibles ressources, mais en encourageant explicitement l’utilisation des données des paires de langues à fortes ressources de la même famille. Ce faisant, nous voulons découvrir dans quelle mesure l’anglais et/ou l’espagnol sont requis pour obtenir des traductions automatiques de haute qualité dans les langues apparentées. S’il s’avère que les traductions des langues à faibles ressources peuvent être réellement améliorées par le transfert d’apprentissage, nous voulons identifier conjointement les meilleures manières de combiner les données disponibles.

La tâche partagée sera divisée en deux sous-tâches : La traduction des résumés de thèse d’Europeana (langues germaniques nordiques depuis/vers l’islandais, le norvégien Bokmål  et le suédois) et la traduction des articles du patrimoine culturel de Wikipédia (langues romanes du catalan à l’occitan, au roumain et à l’italien). La période d’évaluation aura lieu du 29 juin au 6 juillet 2021.

Cliquez ici pour trouver d’autres informations et toutes les échéances importantes. Cet effort conjoint est uniquement possible grâce au support du Gouvernement de la Catalogne et des actions de l’ELRC et de LT-Bridge financées par la CE. Nous sommes vraiment impatients de pouvoir mettre en lumière ces combinaisons linguistiques spéciales avec vous !