Les technologies linguistiques sont essentielles pour créer un marché unique numérique au-delà des barrières linguistiques. Le système de traduction automatique de la Commission européenne eTranslation est un outil essentiel car il permet aux administrations publiques, aux universités, aux ministères — et aujourd’hui aux PME — de communiquer et d’échanger des informations au delà des langues et des frontières.  Toutefois, certaines administrations publiques européennes peuvent exiger des installations sur site à partir et vers leur langue nationale, tandis que les données utilisées pour construire les combinaisons linguistiques peuvent bénéficier à la collectivité dans son ensemble.

Pour remédier à cette situation, Pangeanic, Tilde et KantanMT ont conjugué leurs forces pour l’action CEF Telecom « Traduction neuronale pour l’Union européenne» (NTEU), lancée en septembre 2019. L’objectif de cette action est d’étendre la couverture de eTranslation grâce à la construction d’une ferme de moteurs neuronaux comprenant toutes les combinaisons linguistiques officielles de l’UE, par exemple de l’espagnol à l’allemand, du letton au suédois, du croate à l’italien, ou bien du français vers le polonais, pour n’en citer que quelques-unes.

Selon Manuel Herranz, PDG de Pangeanic, il existe un besoin croissant de traduction automatique dans les administrations publiques européennes et « il y a/voici de nombreuses raisons pour lesquelles, au 21e siècle, le secteur public d’un pays aurait besoin de la traduction automatique en tant que technologie d’État et un service pour ses citoyens ».

En conséquence, l’action NTEU suit un objectif ambitieux qui consiste à créer la plus grande combinaison automatique directe entre deux langues. Pour ce faire, NTEU construira des moteurs de traduction automatique directe entre les 24 langues officielles de l’UE. Il en résultera 23 x 23 = 529 moteurs TAN qui seront partagés avec la Commission européenne et les administrations publiques des États membres de l’UE. 

Les données collectées par la ELRC joueront également un rôle important dans le cadre de ce projet, étant donné qu’elles seront utilisées pour personnaliser les moteurs de traduction automatique afin d’étendre le service eTranslation du MIE par le biais de données générales, de données synthétiques intra-domaines et autres collections. En même temps, toutes les données utilisées dans le cadre du projet NTEU seront mises à disposition par l’intermédiaire du référentiel ELRC-SHARE, dans l’intérêt de la communauté.

Pour de plus amples informations sur le projet, veuillez consulter la page de l’appel ou le site du NREU.  

Autres sources :