Ein zentraler Streitpunkt im Zusammenhang mit KI-Systemen betrifft die Verwendung urheberrechtlich geschützter Daten. Der EU-Praxiskodex für GPAI-Modelle greift diese Problematik auf und formuliert klare Anforderungen an Anbieter. Unternehmer und Rechtsabteilungen müssen verstehen, dass es künftig nicht mehr ausreicht, KI-Modelle technisch leistungsfähig zu machen – vielmehr ist auch die rechtliche Herkunft der Trainingsdaten nachweisbar zu dokumentieren.
Hintergrund
Die zunehmende Nutzung großer, vielseitig einsetzbarer KI-Modelle rückt die rechtliche Herkunft der eingesetzten Daten in den Fokus. Der Praxiskodex dient als Leitfaden, um die Pflichten des AI Acts praktisch umzusetzen. Er schafft Klarheit darüber, welche Nachweise von Anbietern verlangt werden und wie diese im Unternehmensalltag organisiert werden sollten.
Dokumentationspflichten im Urheberrecht
Anbieter müssen künftig präzise darlegen:
- Welche Datenarten (Text, Bild, Audio, Video) im Training eingesetzt wurden.
- Woher diese Daten stammen (Web-Crawling, Lizenzdatenbanken, Drittanbieter, synthetische Daten).
- Auf welcher Rechtsgrundlage die Datenverwendung erfolgte (Lizenzvertrag, Schrankenregelung, Einwilligung).
Für Unternehmen heißt das: Jede verwendete Datenquelle muss überprüft, klassifiziert und dokumentiert werden. Fehlt dieser Nachweis, drohen nicht nur regulatorische Sanktionen, sondern auch urheberrechtliche Klagen von Rechteinhabern.
Rechte der Urheber und Beweislast der Anbieter
Der Kodex stellt klar, dass Rechteinhaber nachvollziehen können müssen, ob ihre Werke im Training genutzt wurden. Anbieter müssen daher Systeme entwickeln, die eine Rückverfolgbarkeit der Datenherkunft ermöglichen. Dies ist insbesondere für große Sprach- oder Bildmodelle eine erhebliche Herausforderung.
Praktisch bedeutet dies:
- Technische Nachvollziehbarkeit muss in die Datenpipeline integriert werden.
- Vertragsmanagement gewinnt an Bedeutung – Lizenzen und Nutzungsrechte müssen eindeutig dokumentiert und archiviert werden.
- Rechtsabteilungen müssen prüfen, ob für alle Daten eine tragfähige Rechtsgrundlage besteht.
Spannungsfeld: Innovation vs. Rechtsschutz
Der Kodex erkennt ausdrücklich das Spannungsfeld zwischen Innovationsförderung und Urheberrechtsschutz. Während einerseits Forschung und Entwicklung nicht behindert werden sollen, wird andererseits die Position von Kreativen und Rechteinhabern gestärkt. Für Unternehmen bedeutet dies: Rechtsklarheit vor Innovation. Wer ohne gesicherte Rechte trainiert, setzt sich erheblichen Haftungsrisiken aus – selbst wenn die Daten nur als kleiner Teil des Trainingsmaterials genutzt wurden.
Handlungsempfehlung für Unternehmen
- Aufbau einer Dateninventur: Welche Daten wurden oder werden für das Training genutzt?
- Lizenzprüfung durch die Rechtsabteilung: Besteht für jede Datenquelle eine tragfähige Rechtsgrundlage?
- Einführung technischer Nachvollziehbarkeit: Daten müssen so dokumentiert sein, dass im Streitfall schnell Auskunft erteilt werden kann.
- Monitoring neuer Leitlinien: Die EU wird ergänzende Hinweise geben, wie etwa Open-Source-Modelle oder TDM-Ausnahmen anzuwenden sind.
Fazit
Der urheberrechtliche Teil des Kodex zwingt Unternehmen, ihre Datennutzung rechtssicher zu organisieren. Für Rechtsabteilungen bedeutet das eine erhebliche Ausweitung ihrer Prüf- und Dokumentationspflichten. Wer hier sauber arbeitet, schafft nicht nur Compliance-Sicherheit, sondern stärkt auch das Vertrauen von Investoren und Kunden.
Kapitel-Download: Urheberrecht (DE)
Urheberrecht & Datenverwendung
Deutsche Kurzfassung des Urheberrechtskapitels mit Anforderungen an Rechtevorbehalte, rechtmäßiges Crawling, Risikominderung und Beschwerdemechanismen.

