PERSONENBEZOGENE DATEN: ELRC-SPEZIFIKATIONEN ZUR ANONYMISIERUNG

Viele Informations- und Kommunikationsbedürfnisse unserer Gesellschaft können von fortschrittlichen Sprachtechnologien profitieren, insbesondere von solchen, die auf Deep Learning beruhen. Dokumente und andere Textdaten müssen den Bürgerinnen und Bürgern in der gesamten EU so weit wie möglich zugänglich sein, dass sie in einer Vielzahl von Sprachen verfügbar sind. Eine Herausforderung ist dabei, dass Organisationen ihre Dokumente so verarbeiten müssen, dass die darin beschriebenen Personen nicht mehr identifiziert werden können, d. h. dass personenbezogene identifizierbare Daten entfernt werden, um diese Dokumente datenschutzkonform speichern und weitergeben zu können (unter Beachtung der EU-Datenschutz-Grundverordnung). Angesichts des Ausmaßes der Informationserstellung in verschiedenen Domänen sollten die Entdeckungsbemühungen durch Instrumente unterstützt werden, die einen Teil des Prozesses automatisieren und den Fachleuten der Domäne ihre Ergebnisse zur Überprüfung zur Verfügung stellen.