Die 12. LRB-Versammlung
Die 12. Versammlung des Language Resource Board, d. h. der Gruppe der Nationalen Ankerpunkte im Rahmen des ELRC-Projekts, fand am 9. November im Panorama-Hotel in Prag statt, während der EU-Ratspräsidentschaft [Link zu Artikel 3?] der Tschechischen Republik. Das Treffen fand in einem Hybrid-Modus statt; 55 Teilnehmern nahmen vor Ort teil und 22 online.
Nach Grußworten von Philippe Gelin, Leiter des Bereichs Mehrsprachigkeit in der Direktion Daten der GD Connect, und Simon Ostermann, ELRC-Koordinator und Senior Researcher am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI), präsentierte Thierry Declerck, Senior Consultant am DFKI, Neuigkeiten zum ELRC-Projekt. Zu den Höhepunkten der letzten Jahre gehören eine fast verdoppelte Anzahl von Sprachressourcen, die seit 2020 von ELRC gesammelt werden, neue Datencrawling-Aktivitäten, zwei erfolgreiche Initiativen zur Sammlung ukrainischer Sprachdaten und eine erhöhte Aktivität und Reichweite des ELRC in den sozialen Medien.
Anschließend stellte Stefania Racioppa (Forscherin am DFKI) das neue ELRC White Paper vor. Die vierte Ausgabe des White Paper befasste sich mit der Verwendung von Sprachdaten in öffentlichen Verwaltungen (ÖV) und in kleinen und mittleren Unternehmen (KMU) in ganz Europa. Es enthält auch aktualisierte LT-Länderprofile für alle mit der CEF verbundenen Länder mit Ergebnisse, die sowohl auf den ELRC-Länderworkshops als auch auf Umfragen basieren, die speziell während der Untersuchungen für das White Paper durchgeführt wurden. Zu den Höhepunkten gehörten Ergebnisse zur Nutzung von Tools zur maschinellen Übersetzung (MÜ) durch ÖV und KMU, die darauf hindeuten, dass insbesondere KMU MÜ-Tools häufiger als ÖV verwenden, und unterstreichen, wie die Bedeutung von Sprachdaten[ Link zu Artikel 2] in den letzten drei Jahren in Europa zugenommen hat.
In einem zweiten Block präsentierten Philippe Gelin, die Programmverantwortlichen des Referats G.3 der Europäischen Kommission, Dhafer Labib und Monica Pretti, Neuigkeiten zum neuen geplanten Language Data Space (LDS). Das Projekt wird eine Fortsetzung einiger der Bemühungen und Aufgaben sein, die im ELRC und im ELG-Projekt (European Language Grid) durchgeführt wurden. Nach der Präsentation eines Überblicks und der Vision der neuen LDS konzentrierten sich die Präsentationen auf die LDS-Struktur, mit Details zu den einzelnen durchzuführenden Aufgaben und der Einrichtung des neuen Center of Excellence for Language Technologies (CELT). Die dritte Präsentation konzentrierte sich auf die Ergebnisse der LDS-Workshop-Reihe, bei der Verbände aus verschiedenen Wirtschaftssektoren Input dazu gaben, wie sie Sprachdaten verwenden und was sie von der LDS erwarten würden. Abschließend moderierte Philippe Gelin eine Diskussionsrunde zur neuen LDS, in der Fragen der NAPs und anderer Teilnehmer zum Budget und zur Organisation des Data Space beantwortet wurden.
Im dritten Block sprach Philippe Gelin über die Führung der neuen LDS und die Rolle, die sie in den europäischen Mitgliedstaaten spielen soll, gefolgt von einer weiteren Diskussionsrunde. Der letzte Block bestand aus drei Präsentationen von Konsortiumsmitgliedern zu den ELRC-Sprachtechnologiespezifikationen:
1. Tom Vanallemeersch, Language AI Advisor bei CrossLang, präsentierte das ELRC Multilingual Fake News Processing Tool.
2. Das von Tilde entwickelte ELRC WordPress Website Translation Tool wurde von Andrejs Vasiļjevs, CEO von Tilde, vorgestellt.
3. Arne Defauw, Machine Learning Engineer bei CrossLang, hielt einen Vortrag über die Einschätzung von Dokumentenkomplexität, Qualität und Lesbarkeit.
Alle Tools sind oder werden öffentlich zugänglich sein. Links zum Download finden Sie in den jeweiligen Präsentationen, die auf der ELRC-Veranstaltungsseite verlinkt sind.
Die Versammlung wurde am späten Nachmittag von Simon Ostermann beendet, gefolgt von einem informellen Beisammensein von Vertretern der Europäischen Kommission, des ELRC-Konsortiums und der nationalen Ankerpunkte.