Digitalisierung-KI icon

Digitalisierung & KI

Standpunkte Wie mit den Urheberrechtsdebatten um KI umgegangen werden könnte

Scott Martens, Senior Tech Evangelist bei Jina AI
Scott Martens, Senior Tech Evangelist bei Jina AI

Die Art und Weise, wie KI-Modelle trainiert werden, stellt die Gesellschaft vor große urheberrechtliche und moralische Fragen. Mit diesen müssen sich künftig auch Gerichte in der EU beschäftigen, schreibt Scott Martens, Technikmissionar bei Jina AI.

von Scott Martens

veröffentlicht am 02.03.2023

aktualisiert am 07.08.2023

Lernen Sie den Tagesspiegel Background kennen

Sie lesen einen kostenfreien Artikel vom Tagesspiegel Background. Testen Sie jetzt unser werktägliches Entscheider-Briefing und erhalten Sie exklusive und aktuelle Hintergrundinformationen für 30 Tage kostenfrei.

Jetzt kostenfrei testen
Sie sind bereits Background-Kunde? Hier einloggen

Können Dinge, die mit Hilfe von KI geschaffen wurden, als geistiges Eigentum zählen? Juristisch befindet man sich in einer Grauzone. Das Urheberrecht schützt Schöpfungen des menschlichen Intellekts. Aber tatsächlich ist der Mensch maßgeblich an der Erzeugung von KI-Inhalten beteiligt. Der Mensch gibt bestimmte Wörter und Befehle vor, um von der KI Bilder erstellen zu lassen. Basierend auf den Ergebnissen verändert der Mensch diese Befehle gegebenenfalls und wählt am Ende das gewünschte Bild aus. Bild- und Musikgeneratoren arbeiten nach demselben Schema. Das ist der Arbeitsweise von Fotograf:innen sehr ähnlich – und deren Arbeit fällt eindeutig unter das Urheberrecht.

Ein großes Problem ist die Art und Weise, wie generative KI-Modelle erstellt werden. Große KI-Modelle sind teuer in der Entwicklung und stammen hauptsächlich aus wenigen Quellen. Jina AI und andere Start-ups sind stark vom Zugang zu diesen großen Modellen abhängig, aber die Art und Weise, wie diese KI-Modelle erstellt werden, werfen auch rechtliche Fragen auf. Open AI, Microsoft, Meta und Google greifen bei der Erstellung ihrer Produkte auf riesige Mengen von Texten, Bildern, Musik und anderen Formaten zurück, die wiederum von Menschen erstellt wurden. Alle diese großen Modelle wurden mit Massendaten aus dem Internet trainiert – teilweise ohne die Erlaubnis der Urheber dieser Daten einzuholen.

In Kalifornien und Großbritannien sind bereits Gerichtsverfahren in vollem Gang, die gegen generative KI vorgehen. Es ist davon auszugehen, dass sich auch bald Gerichte in der EU mit diesem Thema befassen werden. Die Kläger:innen argumentieren, dass allein schon die Nutzung der geistigen Schöpfungen anderer für die Trainingsdaten der KI-Modelle die Autor- und Urheberschaft verletzen würde. Darüber hinaus stelle alles, was durch generative KI produziert wurde, ebenfalls eine Verletzung der Eigentumsrechte dar, da maschinelle Lernmodelle einzig darauf basieren, bereits existierende Daten zu sammeln und durch ihre Rekombination neue Dinge zu produzieren.

Gut möglich, dass KI gerade massiv das Urheberrecht verletzt

In den USA, Großbritannien und in Ländern, die auf einem ähnlichen Rechtssystem basieren, gilt der Grundsatz des „Fair Use“ oder „Fair Dealing“, der das Urheberrecht auf die „angemessene Verwendung“ begrenzt. Damit werden viele Ausnahmen vom Urheberrecht geschaffen, was gegebenenfalls auch auf das KI-Training anwendbar wäre. In der europäischen oder deutschen Gesetzgebung existiert ein solches Konzept jedoch nicht. In Artikel 5 der EU-Urheberrechtsrichtlinie werden vom Urheberrecht ausgenommene Ausnahmen aufgelistet, die allerdings auch nicht auf generative KI anwendbar sind. Seit der Ashby-Entscheidung der Europäischen Menschenrechtskonvention aus dem Jahr 2013 sind europäische Gerichte dazu übergegangen, eine Art „Fair Use“-Prinzip zu verankern, um die Meinungsfreiheit zu schützen. Aber das lässt sich höchstwahrscheinlich nicht auf kommerzielle Software anwenden.

Es ist nicht gesetzeswidrig, das geistige Eigentum anderer zu betrachten und als Inspirationsquelle zu nutzen. Das ist es nicht einmal, wenn man absichtlich den Stil eines Künstlers kopiert – auch wenn es vermutlich nicht zum guten Ton zählt. Die Rechtsvertretungen der KI-Systeme stellen infrage, warum es plötzlich illegal sein solle, wenn KI-Modelle nach demselben Prinzip vorgehen. Künstler:innen lassen dieses Argument zumeist nicht gelten, da es für sie einen Unterschied mache, ob ein Mensch ihre Arbeit kopiert, weil das von eigener künstlerischer Fertigkeit zeuge, ob sie von einer KI kopiert werden. Aber das Recht am geistigen Eigentum schützt das Produkt und nicht dessen Produzenten. Urheberrecht bezieht sich nur auf konkrete geistige Schöpfungen und nicht auf vage Konzepte wie Stil, also begeht KI streng genommen keinen Diebstahl. Auch wenn Künstler:innen es vermutlich nicht hören wollen: Was ihnen vermeintlich gestohlen wurde, hat ihnen nie wirklich gehört.

Niemand kann die Zukunft vorhersagen. Aber es ist gut möglich, dass europäische Gerichte entscheiden werden, dass Modelle, die mit nicht-genehmigten Daten trainiert wurden, das Urheberrecht verletzen. Die Wahrscheinlichkeit ist ebenfalls hoch, dass amerikanische Gerichte die Anwendbarkeit von „Fair Use“ ablehnen. Wie auch immer die Entscheidung ausfällt, es wird das gesamte Feld der KI-Entwicklung beeinflussen. Urheberrechtlich geschützte Daten sind aktuell Bestandteil von allen großen generativen KI-Modellen, beispielsweise ChatGPT und auch Systemen, die Musik produzieren. Das betrifft nicht nur die Bildgeneratoren.

Ein gemeinsamer Satz an Trainingsdaten?

Unabhängig von der rechtlichen Perspektive bleibt die moralische Frage nach dem Nutznießen der generativen KI von Inhalten anderer. Der Gesetzgeber könnte veranlassen, die Urheber finanziell dafür zu entschädigen. Eine Regulierungsmöglichkeit könnte sein, eine Zwangslizensierung – ähnlich der in der Musikindustrie – durchzusetzen. Die Verlagswirtschaft hat keine Angst vor KI und Autor:innen könnten ein solches Vorgehen ebenfalls bereitwillig akzeptieren. Nur Künstler:innen könnte das sauer aufstoßen.

Alternativ könnte die KI-Industrie in einen gemeinsamen Satz an Trainingsdaten investieren und die Urheber dieser Daten finanziell entschädigen. Das würde den Rechtsstreitigkeiten zum Urheberrecht zuvorkommen und anderen Vorbehalten gegenüber KI proaktiv begegnen. Außerdem würde es dafür sorgen, dass (Kunst-)Schaffenden, die selten angemessen bezahlt werden, zumindest ein wenig Lohn für ihre Arbeit zukommt.

Auch wenn man meinen könnte, dass derartige Regulierung den Zugang zum Markt erschwert, hat es doch einige Vorteile: Die Industrie könnte sich besser selbst regulieren, als es jede Regierung von außen tun könnte. Außerdem mögen anstößige Inhalte vielleicht rechtlich (durch Urheberrecht oder freie Meinungsäußerung) geschützt sein. Aber wenn die Industrie die Regeln für ihre Datensätze einheitlich kontrolliert und die genutzten Daten limitiert, dann kann man ausschließen, dass aus bereits existierenden pornografischen oder gewaltverherrlichenden Inhalten neue KI-generierte anstößige Inhalte entstehen. Durch die Lizenzbedingungen wären den Nutzer:innen von KI-Systemen automatisch Grenzen gesetzt.

Wir wollen, dass der aufstrebende deutsche KI-Sektor floriert, und wir brauchen ein stabiles, wettbewerbsfähiges und gut reguliertes Umfeld. Die Ungewissheit über diese Fragen des geistigen Eigentums birgt die Gefahr, dass unsere Open-Source-Technologien untergraben werden und unsere junge Industrie in den Ruin getrieben wird, was zu einer Abwanderung in weniger skrupellose Länder führen könnte.

Scott Martens ist Senior Tech Evangelist bei Jina AI.

Lernen Sie den Tagesspiegel Background kennen

Sie lesen einen kostenfreien Artikel vom Tagesspiegel Background. Testen Sie jetzt unser werktägliches Entscheider-Briefing und erhalten Sie exklusive und aktuelle Hintergrundinformationen für 30 Tage kostenfrei.

Jetzt kostenfrei testen
Sie sind bereits Background-Kunde? Hier einloggen