Inhaltsverzeichnis
- Die digitale Zwickmühle des Urheberrechts: Die rechtlichen und ethischen Grenzen der generativen KI
- Trainingsdaten: Der Ausgangspunkt urheberrechtlicher Streitigkeiten
- KI-generierte Inhalte: Wer ist der Urheber?
- Ähnlichkeit von Werken: Die Grauzone zwischen Inspiration und Plagiat
- Gesetzgebung und Marktanpassung: Der Weg in die Zukunft
- Ausgewogenheit: Ein Überdenken der Interessen aller Parteien
- Schlussfolgerung: Auf dem Weg zu einer symbiotischen Zukunft
Die digitale Zwickmühle des Urheberrechts: Die rechtlichen und ethischen Grenzen der generativen KI
Im Zeitalter der rasanten Entwicklung der künstlichen Intelligenz hat die generative KI mit ihren erstaunlichen kreativen Fähigkeiten die Welt im Sturm erobert. Von Texten über Bilder bis hin zu Musik und Videos scheint die KI allmächtig zu sein. Doch während wir die technologischen Durchbrüche bestaunen, zeichnet sich ein grundlegendes Problem immer deutlicher ab: die Urheberrechtsfragen, die mit der Erstellung dieser KI-Systeme verbunden sind. Da die Grenzen der „Schöpfung“ durch Maschinen verschwimmen, steht der traditionelle urheberrechtliche Rahmen vor noch nie dagewesenen Herausforderungen. Dieser Artikel befasst sich eingehend mit den urheberrechtlichen Schwierigkeiten, die durch generative KI verursacht werden, analysiert bestehende Fälle und rechtliche Fortschritte und denkt über mögliche Lösungswege nach.
Trainingsdaten: Der Ausgangspunkt urheberrechtlicher Streitigkeiten
Die Fähigkeit der generativen KI beruht auf ihren Trainingsdaten. Ob GPT, DALL-E, Midjourney oder Stable Diffusion, diese Modelle erlernen Kreativitätstechniken, indem sie riesige Mengen menschlicher Werke studieren. Dieser grundlegende Trainingsprozess wirft jedoch bereits das erste urheberrechtliche Problem auf.
Datenerfassung und der Streit um die „Fair Use“
Die Trainingsdaten großer Sprachmodelle von Unternehmen wie OpenAI und Anthropic enthalten große Mengen an Online-Texten, darunter viele urheberrechtlich geschützte Inhalte. Laut einer Untersuchung der „New York Times“ enthalten die Trainingsdaten von OpenAI über 11.000 Bücher, darunter nicht autorisierte Bestseller. Dies hat zu mehreren wichtigen Klagen geführt:
- Im Dezember 2023 verklagte die „New York Times“ OpenAI und Microsoft wegen der unbefugten Nutzung von Millionen urheberrechtlich geschützter Nachrichtenartikel zum Trainieren von ChatGPT.
- Der Schriftsteller George Martin (Autor von „Game of Thrones“) und 17 weitere bekannte Autoren reichten eine Sammelklage gegen OpenAI wegen Urheberrechtsverletzung ein.
- Getty Images verklagte Stability AI (Entwickler von Stable Diffusion) wegen der unbefugten Verwendung von Millionen von Getty-Fotos zum Trainieren.
Der Kern dieser Fälle dreht sich um die Frage, ob die KI-Unternehmen argumentieren, dass ihre Datennutzung unter die „Fair Use“-Doktrin des US-Urheberrechtsgesetzes fällt, da:
- Sie kopieren oder zeigen nicht direkt die Originalinhalte.
- Das Modell extrahiert Muster und nicht spezifische Inhalte aus den Daten.
- Diese Verwendung hat einen „transformatorischen Charakter“ und dient einem anderen Zweck.
Content-Ersteller argumentieren jedoch:
- Kommerzielle Unternehmen profitieren von der unbefugten, groß angelegten Nutzung urheberrechtlich geschützter Inhalte.
- KI-Produkte stehen in direktem Wettbewerb mit Originalautoren.
- Es wird kein Entschädigungsmechanismus bereitgestellt.
Die vorläufige Entscheidung des US-Bezirksgerichts für den südlichen Bezirk von New York im Fall „Andersen v. Stability AI“ im Jahr 2023 könnte wegweisend sein. Der Richter befand, dass die Berufung auf Fair Use nur aufgrund der Verwendung zum Trainieren von KI nicht ausreicht und von Fall zu Fall analysiert werden muss.
Ausnahme für Text- und Data-Mining in der EU und globale Unterschiede
Im Gegensatz zu den Vereinigten Staaten sieht das EU-Urheberrecht eine ausdrückliche Ausnahme für Text- und Data-Mining vor. Artikel 3 und 4 der Richtlinie über den digitalen Binnenmarkt erlauben Forschungseinrichtungen und anderen Einrichtungen die Durchführung von Text- und Data-Mining, aber Artikel 4 gewährt den Rechteinhabern auch das Recht, sich abzumelden („Opt-out“).
Das japanische Urheberrechtsgesetz ist noch offener und erlaubt ausdrücklich die Verwendung urheberrechtlich geschützter Inhalte für Datenanalysezwecke, was Japan zu einem KI-freundlichen Umfeld macht.
Diese Inkonsistenz im globalen Rechtsrahmen führt zu einem Phänomen der „rechtlichen Arbitrage“ in der KI-Entwicklung. Unternehmen können sich dafür entscheiden, das Modelltraining in Regionen mit einem laxeren rechtlichen Umfeld durchzuführen.
KI-generierte Inhalte: Wer ist der Urheber?
Ein weiteres Kernproblem ist: Wem sollten KI-generierte Inhalte gehören? Können sie urheberrechtlich geschützt werden?
Unterschiedliche Positionen globaler Urheberrechtsbehörden
Das US Copyright Office lehnte 2023 den Urheberrechtsschutz für das von Midjourney generierte Bild „Teatro D'opera Spatial“ ab und erklärte in seiner Grundsatzerklärung „Künstliche Intelligenz und Urheberrecht“ deutlich: „Das Prinzip des menschlichen Urhebers ist der Eckpfeiler des Urheberrechtsschutzes, und das US-Urheberrecht schützt nur intellektuelle Werke des Menschen.“ Das Copyright Office erklärte jedoch auch, dass der kreative Beitrag des Menschen in Werken, die in Zusammenarbeit zwischen Mensch und KI entstanden sind, geschützt werden kann.
Das britische Amt für geistiges Eigentum vertritt einen flexibleren Standpunkt. Gemäß seinen Richtlinien „Urheberrecht und KI-generierte Werke“ können KI-generierte Werke urheberrechtlich geschützt sein, der „Urheber“ wird jedoch als die Person betrachtet, „die die Vorkehrungen getroffen hat, damit das Werk erstellt wird“.
Das chinesische Urheberrechtsgesetz, das 2020 geändert wurde, schließt die KI-Erstellung nicht ausdrücklich aus, was in gewisser Weise Raum für den urheberrechtlichen Schutz von KI-generierten Inhalten bietet.
Lehren aus wegweisenden Fällen
Im Jahr 2022 versuchte der US-amerikanische Autor Charles Bazan, das Urheberrecht für den Roman „Zarya of the Dawn“ anzumelden, der von Midjourney generierte Illustrationen enthielt. Das Copyright Office gewährte schließlich nur das Urheberrecht für den Textteil und lehnte den Bildteil ab.
Noch umstrittener ist, dass GitHub Copilot von Microsoft und OpenAI mit einer Sammelklage konfrontiert ist, weil der generierte Code möglicherweise Originalcodefragmente aus den Trainingsdaten enthält. Dieses „Gedächtnis“-Phänomen wirft Bedenken auf, ob KI-Systeme Originalinhalte direkt kopieren können.
Ähnlichkeit von Werken: Die Grauzone zwischen Inspiration und Plagiat
Ein weiteres Problem, das durch generative KI aufgeworfen wird, ist: Wie kann man feststellen, ob eine Urheberrechtsverletzung vorliegt, wenn KI-generierte Inhalte bestehenden Werken ähneln?
„Stilimitation“ und Urheberrechtsgrenzen
Die typischste Kontroverse kommt aus dem Bereich der Bildgenerierung. Benutzer können die KI auffordern, „im Stil von Van Gogh zu erstellen“ oder „wie ein Disney-Animationsfilm“, was Bedenken hinsichtlich des Stilplagiats aufwirft. Im Jahr 2023 reichten mehrere Künstler, darunter Kelly McKernan und Greg Rutkowski, Klage ein und beschuldigten Stability AI und Midjourney, ihren Kunststil verletzt zu haben.
Das traditionelle Urheberrechtsgesetz schützt jedoch nicht Stil, Technik oder Ideen, sondern nur konkrete Ausdrucksformen. Dieses Prinzip steht im KI-Zeitalter vor Herausforderungen, da KI die stilistischen Merkmale von Künstlern systematisch erlernen und nachahmen kann.
Entfernen von Originalelementen aus Trainingsdaten
Einige KI-Unternehmen versuchen, das Urheberrechtsrisiko durch technische Mittel zu mindern:
- OpenAI hat in DALL-E 3 einen Filter hinzugefügt, der Anfragen zur Generierung von Inhalten im Stil bestimmter Künstler ablehnt.
- Das Claude-Modell von Anthropic lehnt die Wiederholung vollständiger urheberrechtlich geschützter Inhalte ab.
- Midjourney verbietet Benutzern ausdrücklich, bestimmte bekannte Künstlernamen als Prompts einzugeben.
Studien zeigen jedoch, dass die Wirksamkeit dieser Maßnahmen begrenzt ist. Forscher der Stanford University fanden heraus, dass die Verwendung verwandter deskriptiver Begriffe selbst dann, wenn der Name des Künstlers nicht direkt verwendet wird, dazu führen kann, dass die KI Werke in einem ähnlichen Stil generiert.
Gesetzgebung und Marktanpassung: Der Weg in die Zukunft
Angesichts dieser Herausforderungen erforschen Gesetzgeber, Unternehmen und Schöpfer weltweit verschiedene Wege:
Neue Gesetzgebungsversuche
Das EU-Gesetz über künstliche Intelligenz verlangt von Anbietern generativer KI, die urheberrechtlich geschützten Inhalte, die für ihr Training verwendet werden, offenzulegen und den Rechteinhabern einen Mechanismus zum Opt-out zu bieten.
Der vom US-Senat eingebrachte CLUE Act (Clarifying Lawful Use of Our Valuable Intellectual Property Act) soll klären, ob KI-Training eine faire Nutzung darstellt, wurde aber bisher nicht verabschiedet.
Die chinesische nationale Urheberrechtsbehörde schlug in den 2023 veröffentlichten „Leitlinien zur Stärkung des Urheberrechtsschutzes für von künstlicher Intelligenz generierte Inhalte“ vor, dass von künstlicher Intelligenz generierte Inhalte, die originell sind und durch den kreativen Ausdruck einer natürlichen Person entstehen, urheberrechtlich geschützt werden können.
Lizenz- und Entschädigungsmodelle
Einige Unternehmen haben begonnen, Lizenzmodelle zu erforschen:
- Associated Press hat eine Vereinbarung mit OpenAI getroffen, die es letzterem erlaubt, sein Nachrichtenarchiv zu nutzen.
- Shutterstock hat Partnerschaften mit OpenAI und Stability AI aufgebaut, die die Verwendung seiner Bildbibliothek für das KI-Training ermöglichen und einen Entschädigungsfonds einrichten.
- Adobe Stock hat ein „KI-freundliches“ Lizenzprogramm für generative KI erstellt, das die Verwendung bestimmter Inhalte für das KI-Training ausdrücklich erlaubt.
Diese Vereinbarungen stellen eine mögliche Marktlösung dar: Durch direkte Lizenzvereinbarungen wird sichergestellt, dass die Urheber entschädigt werden.
Technische Lösungen
Auch Technologien wie Blockchain und digitale Wasserzeichen wurden als Instrumente zur Lösung von Urheberrechtsproblemen vorgeschlagen:
- Der C2PA-Standard (Content Provenance and Authenticity Alliance) für die Inhaltsauthentifizierung hilft bei der Identifizierung von KI-generierten Inhalten.
- Midjourney und DALL-E betten Metadaten in generierte Bilder ein, die deren KI-Herkunft angeben.
- Einige Start-up-Unternehmen haben Tools entwickelt, die KI-generierte Inhalte von menschlicher Erstellung unterscheiden können.
Ausgewogenheit: Ein Überdenken der Interessen aller Parteien
Um die urheberrechtlichen Probleme der generativen KI zu lösen, muss ein Gleichgewicht zwischen mehreren Interessengruppen gefunden werden:
Die legitimen Rechte der Content-Ersteller
Originalautoren haben Anspruch auf Schutz und Entschädigung. Die Schauspielergewerkschaft SAG-AFTRA machte Beschränkungen für die KI-Nutzung zu einer ihrer Hauptforderungen im Streik von 2023, und die endgültige Vereinbarung verlangt von den Produktionsfirmen, dass sie die Zustimmung einholen und eine Entschädigung leisten, bevor sie die Bilder von Schauspielern mit KI kopieren.
Ebenso erforscht die Musikindustrie aktiv Schutzmechanismen. Der CEO der Universal Music Group, Lucian Grainge, erklärte 2023: „KI kann ein Werkzeug für Künstler sein, darf aber kein Ersatz sein.“
Technologische Entwicklung und öffentliches Interesse
Gleichzeitig können zu strenge Beschränkungen den technologischen Fortschritt und das gesellschaftliche Wohl behindern. KI-Forscher weisen darauf hin, dass die Entwicklung von Modellen zu teuer wäre und Innovationen einschränken würde, wenn für jede Trainingsdateneingabe eine separate Genehmigung erforderlich wäre.
Eine potenzielle ausgewogene Lösung ist die Einrichtung eines Statutory-License-Systems, ähnlich dem Mechanical-License-System in der Musikindustrie, das die Verwendung geschützter Inhalte gegen Zahlung einer angemessenen Gebühr ermöglicht.
Schlussfolgerung: Auf dem Weg zu einer symbiotischen Zukunft
Die urheberrechtlichen Herausforderungen, die durch generative KI entstehen, haben keine einfachen Lösungen. Die technologische Entwicklung übertrifft die Geschwindigkeit der Rechtsanpassung bei weitem, und diese Kluft muss durch die gemeinsame Anstrengung mehrerer Parteien geschlossen werden.
Die wahrscheinlichste zukünftige Entwicklung ist: die schrittweise Verbesserung des Rechtsrahmens, die Innovation von kommerziellen Lizenzmodellen, die Unterstützung technischer Instrumente sowie ein tiefergehender Dialog und eine Zusammenarbeit aller Interessengruppen. Dabei müssen wir sowohl die legitimen Rechte der Schöpfer schützen als auch Raum für technologische Innovationen schaffen, um letztendlich ein Ökosystem zu schaffen, in dem KI und menschliche Kreativität in Symbiose leben.
So wie das Urheberrecht im Grunde darauf abzielt, die Entwicklung von Wissen und Kultur zu fördern, müssen wir uns angesichts der Herausforderungen des KI-Zeitalters auf dieses Kernkonzept besinnen und ein Gleichgewicht finden, das sowohl die menschliche Kreativität als auch die technologische Innovation anregt. Dies ist nicht nur eine rechtliche Frage, sondern auch eine Frage, wie wir Kreativität selbst definieren und wie Menschen und Maschinen in dieser neuen Ära koexistieren sollen.