EU2022.CZ: LT-bezogene Initiativen

pictureSprachtechnologien stellen sich als ein Schlüsselfaktor in der europäischen AI-Landschaft heraus. Während der tschechischen EU-Ratspräsidentschaft haben mehrere Veranstaltungen unterstrichen, wie relevant dieses Thema in den letzten Jahren geworden ist. 

Im Oktober war die Top-Veranstaltung im Bereich Forschungsinfrastrukturen die ICRI-2022-Konferenz in Brünn, eine offizielle Präsidentschaftsveranstaltung unter der Schirmherrschaft des Ministers für europäische Angelegenheiten der Tschechischen Republik, Prof. M. Bek. Das CLARIN-ERIC-Netzwerk und die LINDAT/CLARIAH-CZ-Forschungsinfrastruktur, die primären LT-Datenspeicher sowie Entwickler von Tools und Diensten in der Tschechischen Republik, wurden durch Franciska de Jong, die Geschäftsführerin von CLARIN, vertreten. Darüber hinaus erhielt die CLARIN-Jahreskonferenz 2022, die von LINDAT/CLARIAH-CZ in Prag organisiert wurde, den Status eines Satellite Events von ICRI 2022. 

Unter anderen offiziellen Veranstaltungen des tschechischen Ratsvorsitzes ist der gemeinsame tschechisch-französische Workshop über AI im September zu erwähnen, der einen Block von vier eingeladenen Vorträgen – gemeinsam organisiert von den LRB-Mitgliedern François Yvon und Jan Hajič – über natürliche Sprachverarbeitung und grundlegende Modelle umfasste. Im November findet in Prag die jährliche EBDVF-Konferenz (European Big Data Value Forum) als weitere offizielle Präsidentschaftsveranstaltung statt, die gemeinsam von BDVA und der Karls-Universität, LINDAT/CLARIAH-CZ und mehreren anderen BDVA-Mitgliedern in der Tschechischen Republik organisiert wird. LT wird in mehreren Sitzungen (wie in der von LRB-Mitglied Andrejs Vasiljevs über Sprachtechnologie geleiteten) mit mehreren Referenten aus der LT-Community vertreten sein. Auf der EBDVF 2022 wird das ELRC-LRB-Mitglied Jan Hajič auf der einführenden Plenarsitzung mit dem Titel How a strong ecosystem for Data and AI contribute to the strategic resilience of the European economy? sprechen. 

Übrigens hat das Projekt HLPT (High Performance Language Technology) Horizon Europe, das vom Institut für formale und angewandte Linguistik der Karls-Universität Prag koordiniert wird, gerade begonnen und zielt darauf ab, große Textressourcen zu schaffen und große Sprach- und Übersetzungsmodelle für EU-Sprachen aufzubauen. Das Institut wird auch durch ELRC-LRB-Mitglied Pavel Pecina in zwei weiteren LT-bezogenen Projekten vertreten: RES-Q+ und MEMORISE.

Auf der rechtlichen Seite führt der tschechische Ratsvorsitz das AI-Gesetz durch, eine vorgeschlagene umfassende AI-Verordnung, die nach ihrer Verabschiedung tiefgreifende Auswirkungen auf alle LTs sowie auf ihre Klassifizierung als Allzweck-AI haben wird. Positiv zu vermerken ist, dass die Tschechische Republik kurz davor steht, die EU-Urheberrechtsrichtlinie 2019 in diesem Herbst umzuwandeln und zu verabschieden, die es – insbesondere innerhalb von Forschungsorganisationen, aber auch in Unternehmen – ermöglicht, fast alle Textdaten, die die Forscher dank der TDM-Ausnahme (Artikel 3 und 4 der ursprünglichen Richtlinie) erhalten können, frei zu erkunden.