EU2022.CZ : Initiatives en matière de TL

picture

Les technologies linguistiques commencent à apparaître comme un facteur clé dans le paysage européen de l’IA. Durant la présidence tchèque du Conseil de l’Union européenne, plusieurs évènements ont souligné combien cette question était devenue pertinente au cours des dernières années. 
ICRI 2022, conférence phare dans le domaine des infrastructures de recherche, a été organisée à Brno en octobre en tant qu’évènement officiel de la présidence, sous les auspices du ministère des Affaires européennes de la République tchèque, le professeur Mikuláš Bek. Le réseau CLARIN ERIC et l’infrastructure de recherche LINDAT/CLARIAH-CZ, qui sont les premiers développeurs de répertoires de donnée et d’outils et services de TL  en République tchèque, étaient représentés par Franciska de Jong, Directrice exécutive de CLARIN. La conférence annuelle CLARIN 2022, organisée par LINDAT/CLARIAH-CZ à Prague, avait en outre le statut d’évènement satellite de l’ICRI 2022. 
Parmi les autres évènements officiels de la présidence tchèque, il convient de mentionner l’atelier conjoint franco-tchèque sur l’IA du mois de septembre et son bloc de quatre présentations invitées sur le traitement automatique des langues (naturelles) et les modèles fondationnels, co-organisé par François Yvon et Jan Hajič, membres du LRB. En novembre, la conférence annuelle EBDVF (European Big Data Value Forum), nouvel évènement officiel de la présidence co-organisé par la BDVA et Charles University, LINDAT/CLARIAH-CZ et plusieurs autres membres de la BDVA en République tchèque, aura lieu à Prague. Les TL figureront à l’affiche de plusieurs sessions (telles que celle animée par Andrejs Vasiljevs, membre du LRB, sur les technologies linguistiques) avec plusieurs conférenciers de la communauté des TL. À l’EBDVF 2022, Jan Hajič, membre du LRB de l’ELRC, prendra la parole lors d’une séance plénière inaugurale intitulée How a strong ecosystem for Data and AI contribute to the strategic resilience of the European economy? (Comment un écosystème solide pour les données et l’IA contribue-t-il à la résilience stratégique de l’économie européenne ?). 
D’ailleurs, le projet HLPT (High Performance Language Technology) Horizon Europe, coordonné par l’Institut de linguistique formelle et appliquée de l’Université Charles de Prague, vient de démarrer. Il vise à créer de grandes ressources textuelles et à élaborer de grands modèles linguistiques et de traduction pour les langues de l’UE. L’Institut est aussi représenté par Pavel Pecina, membre du LRB de l’ELRC, dans deux autres projets liés aux TL : RES-Q+ et MEMORISE.
Sur le plan juridique, la présidence tchèque poursuit ses travaux sur l’IA Act, une proposition de règlementation générale sur l’IA qui, une fois adoptée, aura une incidence importante sur toutes les TL et, compte tenu de sa classification, sur l’IA à usage général. Sur une note positive, la République tchèque est sur le point de transformer et d’adopter cet automne la directive européenne de 2019 sur les droits d’auteur qui permet, en particulier dans les organismes de recherche, mais aussi dans les entreprises, d’explorer librement presque n’importe quelle donnée textuelle que les chercheurs peuvent obtenir grâce à l’exception TDM (articles 3 et 4 de la directive d’origine).