Schalast | Urheberrecht und Künstliche Intelligenz
1. Urheberrecht und künstliche Intelligenz.
Bis zum Ende des vorigen Jahrhunderts fand das Urheberrecht, das insbesondere die „Werke der Literatur, Wissenschaft und Kunst“ (§ 1 Urheberrechtsgesetz - UrhG) schützt, in der analogen Welt statt. Dann wurde es durch die Digitalisierung in seinem Kern, dem ausschließlichen Recht des Urhebers zur Vervielfältigung und Verbreitung seines Werks, getroffen. Die früheren Formen der Vervielfältigung wie das Nachschnitzen von Skulpturen, heimliche Konzertmitschnitte auf dem Kassettenrekorder oder der fotomechanische Bürokopierer wirken heute biedermeierhaft.
In diese Welt schlugen beispielsweise die ersten (inzwischen fast vergessenen) Musiktauschbörsen wie Bomben ein. Den Herausforderungen der Digitalisierung hat sich das Urheberrecht durch umfängliche Ergänzungen und Modifikationen unter Beibehaltung seiner Grundstrukturen gewachsen gezeigt.
Vor nicht weniger gravierende Herausforderungen sieht sich das Urheberrecht heute (und täglich mehr) durch Künstliche Intelligenz gestellt. Ganz neue Fragen stellen sich im Hinblick darauf, wer (falls überhaupt) für was Schutz genießt und wer sich umgekehrt ohne zu fragen oder zu bezahlen an geistigem Material bedienen darf, das er nicht selbst geschaffen hat.
Bilder von Donald Trump beim Reinigen seiner Gefängniszelle, ein Lied scheinbar vorgetragen von einer populären Sängerin, die es aber nie eingespielt hat oder die Fortschreibung eines Seriendrehbuchs ohne Autor – Künstliche Intelligenz macht es möglich.
Als Künstliche Intelligenz bezeichnet man die Fähigkeit einer Maschine, menschliche Fähigkeiten wie Kreativität, logisches Denken, Planen oder Lernen zu imitieren. Die „generative“ KI bringt z.B. Texte, Softwarecodes, Musik oder Comic-Zeichnungen hervor, die es so konkret vorher nicht gab. Das Ausgangsmaterial wird vor allem im Internet in unvorstellbaren Mengen gesammelt und kopiert. Die erhobenen „Daten“ (zu denen auch bedeutendste literarische und künstlerische Werke gehören können) werden gesammelt, extrahiert, verarbeitet und im Hinblick auf Ziele und Parameter der jeweiligen KI modelliert und interpretiert („Training“ der KI). Das kopierte Material wird in einer Weise digital verarbeitet, die einen anschließenden „Remix“ des je nach Aufgabenstellung benötigten Materials zur Hervorbringung gleichartiger, aber neuer Ergebnisse ermöglicht. Das Ausgangsmaterial wird in aller Regel massenhaft urheber- oder leistungsschutzrechtlich geschützte Werke enthalten.
2. Der Input: Text und Data Mining
Gewonnen wird das Ausgangsmaterial vor allem durch „Text und Data Mining“. Darunter versteht das Gesetz „die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen“ (§ 44 b UrhG). Diese Definition beruht auf einer EU-Richtlinie aus dem Jahr 2019.
Vervielfältigungen von rechtmäßig zugänglichen Werken werden für diesen Zweck für zulässig erklärt. Allerdings kann der Rechtsinhaber bei seinen online zugänglichen Werken einen Nutzungsvorbehalt erklären, der aber maschinenlesbar sein muss. § 60 d UrhG enthält Sonderregelungen für Zwecke der wissenschaftlichen Forschung.
Der Begriff „Werk“ ist in diesen Vorschriften durchaus im technischen Sinne zu verstehen (vgl. § 2 II UrhG: „Werke im Sinne dieses Gesetzes sind nur persönliche geistige Schöpfungen.“), denn das Schürfen nicht oder nicht mehr geschützten Materials bedarf keiner Freistellung. Für verwandte Schutzrechte (also z.B. Lichtbilder gegenüber Lichtbildwerken, Tonträger oder Sendungen als solche, d.h. unabhängig vom – i.d.R. als Werke geschützten - Inhalt) werden diese beiden urheberrechtlichen Schrankenbestimmungen – wie alle anderen – in den einzelnen Vorschriften betreffend verwandte Schutzrechte für anwendbar erklärt.
§ 44 b und 60 d UrhG schreiben eine Entwicklung fort, die 2001 eingesetzt hat: Damals hat die EU temporäre, flüchtige Kopiervorgänge erlaubt, die Teil eines technischen Prozesses sind und ohne die digitale Technologien nicht auskommen können (§ 44 a UrhG). KI erfordert aber in der Regel die Erstellung eines stabilen Referenzkorpus, in dem Inhalte zum Zwecke der Weiterverarbeitung jedenfalls für eine gewisse Dauer gespeichert werden.
Für das Schürfen von Texten und Daten steht nicht nur alles zur Verfügung, was frei im Internet zugänglich ist, sondern es können bislang nur analog verfügbare Werke für diese Zwecke auch digitalisiert werden. In den klassischen Kategorien des Urheberrechts werden geschützte Bestandteile des geschürften Materials i.d.R. „vervielfältigt“ (§ 16 UrhG), aber aufgrund einer Sonderbestimmung in § 23 III UrhG nicht i.S. dieser Vorschrift „bearbeitet“. Eine Vergütungs- oder Zitierpflicht besteht nicht.
In den USA hingegen ist das Schürfen von öffentlich zugänglichen Daten unter ethischen und juristischen Beschuss von Autoren geraten, die sich das Verfüttern ihrer geschürften Werke zum Zwecke des „Trainings“ von KI-Systemen nicht gefallen lassen wollen. Vielmehr wollen sie um Erlaubnis gefragt, als Quelle genannt und entlohnt werden. Sie argumentieren, die KI-Entwickler würden heimlich Milliarden von Wörtern und Bildern aus Büchern, Blogs, Artikeln, Mails und Chats „stehlen“, sie verdauen und wieder „erbrechen“. Das ganze System sei parasitär und produziere nur abgeleitete Ergebnisse.
Dieser Ansatz entfernt sich von urheberrechtlichen Vorstellungen insoweit, als auf die Wiedererkennbarkeit auch nur von zerstückelten Werkfetzen nicht mehr abgestellt wird. Ein Problem der Beschwerdeführer dabei ist, dass sie i.d.R. gar nicht sicher wissen können, ob ihre jeweiligen Werke überhaupt in das Trainingsmaterial eingegangen sind. Ein Ausnahmefall ist die Klage der Getty Images (US) Inc. gegen den KI-Betreiber Stability AI, Inc. Hier legte die Klägerin von der Software der Beklagten generierte Bilder vor, auf denen - wenn auch verzerrt – die Marke und das „Wasserzeichen“ der Klägerin klar erkennbar sind. In der Regel aber dürften Urheber zur Geltendmachung von (unterstellten) Ansprüchen aber zunächst auf Auskünfte der KI-Entwickler angewiesen sein (wobei es zweifelhaft erscheinen mag, ob diese überhaupt selbst wissen, welche Beiträge in die von ihren Maschinen erstellten Bild- und Textkorpora eingegangen sind).
Die EU plant im Rahmen ihrer derzeit in Arbeit befindlichen KI-Gesetzgebung, dass die Entwickler generativer KI von ihnen verwendetes, urheberrechtlich geschütztes Material offenlegen müssen. Ob das geltendes Recht wird, und welcher Anstrengungen gegebenenfalls seine Einhaltung bedürfen wird, ist abzuwarten.
3. Der Output:
a) Ist der Output geschützt und gegebenenfalls für wen?
Zunächst stellt sich die Frage, ob das mit Hilfe von KI erzeugte Ergebnis selbst Schutz nach dem UrhG genießen kann. Grundsätzlich ist das nicht der Fall, denn § 2 II UrhG verlangt eine „persönliche, geistige Schöpfung“ (ähnlich das Patentgesetz, wonach Patente nur für „auf erfinderischer Tätigkeit“ beruhende Lösungen technischer Aufgaben erteilt werden).
Konkret arbeitet etwa ein Textgenerator wie ChatGPT nach demselben Prinzip wie die Autovervollständigung bei Suchbegriffen, Adressbüchern oder E-Mail-Programmen: Aufgrund ihrer „Erfahrung“ schreitet die Maschine von Wort zu Wort fort, entdeckt Muster und wählt die jeweils „wahrscheinlichste“ Fortsetzung. Der Unterschied zum Adressbuch ist die unendlich viel größere Datenmenge, aus der sich die KI bedient.
Ein noch so eindrucksvolles Ergebnis erlangt also keinen Urheberrechtsschutz, wenn es in der Black Box ausschließlich durch im aufbereiteten Rohmaterial automatisch ablaufende Algorithmen generiert wird. Anders möglicherweise, wenn der schöpferische Beitrag eines Menschen einen erkennbaren Niederschlag im fertigen Ergebnis gefunden hat. Dies dürfte der Fall sein bei einem Doppelporträt zweier Frauen, dessen Schöpfer im April 2023 der „Sony World Photography Award“ verliehen wurde. Sein Wettbewerbsbeitrag war aber nicht mit der Kamera, sondern durch verbale Anweisungen (sogenannte „prompts“) an eine Software erstellt worden. Der Preisträger lehnte die Annahme des Awards auf offener Bühne ab. Dies war als Augenöffner zweifellos verdienstvoll, berührt aber nicht die Frage, ob sein Arbeitsergebnis aufgrund seiner detaillierten Anweisungen und darin zutage tretender persönlicher Handschrift nicht als Werk eigener Art nach dem UrhG geschützt werden könnte oder sollte.
Erst recht kommt Urheberrechtsschutz in Betracht, wenn und soweit die menschliche Kreativität im fertigen Ergebnis mit Hilfe schon bekannter (analoger oder digitaler) Techniken ihren Niederschlag gefunden hat: Beispielsweise hat das U.S. Copyright Office die Urheberschaft einer Künstlerin an einem Comicstrip anerkannt, die sich die Handlung des Comics selbst ausgedacht und die von der KI erzeugten Bilder nachträglich mit einem Bildbearbeitungsprogramm gezielt verändert hatte. Die unbearbeiteten Bilder hingegen seien ungeschützt, weil sie rein maschinell erstellt und – anders als bei der menschlichen Zeichnung – „nicht vorhersehbar“ gewesen seien.
Die im Rahmen der künstlichen Intelligenz verwendeten Computerprogramme genießen selbstverständlich als solche Schutz. Dieser hat jedoch mit einem möglichen Schutz der vom Anwender mit Hilfe des Programms erzeugten Ergebnisse nichts zu tun. Insoweit sind die Programme nur Werkzeuge, bei deren Benutzung mehr oder weniger genaue Vorgaben oder Anweisungen im Spiel sind, die die KI nach Wahl des Nutzers mehr als Zufallsgenerator oder als Gehilfin bei der Umsetzung des menschlichen Gestaltungswillens einsetzen. Für einen etwaigen Schutz des fertigen Erzeugnisses wird es darauf ankommen, welche Anteile auf die menschliche Kreativität bei der Aufgabenstellung und welche auf die maschinelle Imitation des geschürften und aufbereiteten Bestandes an vorbekannten Werken zurückzuführen sind.
b) Wann verletzt der Output ältere Rechte?
Die Tatsache, dass das Schürfen, Kopieren und Verarbeiten von frei zugänglichen Werken und verwandten Schutzgegenständen insbesondere zum „Training“ der KI in der EU erlaubt ist, bedeutet nicht, dass anschließend mit Hilfe der KI erzeugte Bilder, Texte, Musik, usw. im Ausgangsmaterial enthaltene, geschützte Werke nicht verletzen könnten.
Urheber- und (ebenfalls im UrhG geregelte) verwandte Leistungsschutzrechte sind – wie Marken, Designs oder Patente – nicht nur gegen identische Kopien geschützt, sondern auch gegen bestimmte Abwandlungen. Im Urheberrecht ist § 23 „Bearbeitungen und Umgestaltungen“ einschlägig, dessen Absatz (1) wie folgt lautet:
- „(1) 1 Bearbeitungen oder andere Umgestaltungen eines Werkes … dürfen nur mit Zustimmung des Urhebers veröffentlicht oder verwertet werden.
- 2 Wahrt das neu geschaffene Werk einen hinreichenden Abstand zum benutzten Werk, so liegt keine Bearbeitung oder Umgestaltung i.S.d. Satzes 1 vor.“
Gemäß Absatz (2) bedarf bei bestimmten Werken nicht erst die Veröffentlichung oder Verwertung der Zustimmung des Urhebers, sondern bereits das Herstellen der Bearbeitung oder Umgestaltung.
Die Bestimmung des Schutzumfangs eines Werkes durch Auslegung von § 23 Abs. (1) Satz 2 gehört zu den schwierigsten Aufgaben, denen sich ein Urheberrechtler seit jeher stellen muss. Zu ihrer Bewältigung wurden anschauliche Formulierungen geprägt, wie die, dass der Urheber sich gegen Bearbeitungen und Umgestaltungen wehren könne, solange die individuellen Züge seines Werkes nicht hinter denjenigen des Ergebnisses der Umgestaltung „verblassen“ bzw., umgekehrt, noch „durchscheinen“.
Erlaubt ist stets die Benutzung eines fremden Werks lediglich als Anregung oder Inspiration zu im Übrigen selbständigem Schaffen.
Diese traditionellen Regeln gelten grundsätzlich auch für Resultate, die von oder mit Hilfe von KI gestaltet wurden. Auf das jeweilige Gewicht der Beiträge von Mensch und Maschine kommt es nicht an: Entweder wird der erforderliche „Abstand zum benutzten Werk“ (§ 23 (1) 2 UrhG) eingehalten oder nicht.
Durch die Eigenheit der KI, sich einer (u.U. unübersehbaren) Menge vorbekannten Materials zu bedienen und aus ihr zu schöpfen, wird die Möglichkeit einer „Zurückverfolgung“ ihres Resultats auf ein bestimmtes vorbekanntes Werk meist kaum möglich sein. Besonders betroffen sind hiervon Komponisten und Songschreiber: Melodien und Akkordfolgen gehen beim „Training“ in der Datenmasse unter und tauchen in der Regel jenseits jeder Kenntlichkeit wieder auf. Durch die rasante Fortentwicklung und Erweiterung bestehender KI-Systeme verschärft sich dieses Problem fortlaufend.
Auch die unter Nutzern beliebte Aufgabenstellung, die KI möge z.B. ein Gedicht „in der Manier von“ einem bestimmten Autor oder einer Epoche schreiben oder ein Bild „im Stil von“ einem bestimmten Maler erstellen, mag die Manier oder den Stil verblüffend imitieren. Auch hier wird aber die traditionelle Regel gelten, dass Manieren oder Stile von Künstlern als solche keinen Schutz genießen, sondern grundsätzlich nur konkrete Werke. Literarische oder Comic-Figuren hingegen können bei hinreichend eigenschöpferischer Prägung auch als solche Schutz genießen mit der Folge, dass eine Verwendung solcher Figuren für eigene Geschichten das Urheberrecht an den Charakteren verletzen kann. Ein „prompt“ z.B. des Inhalts, Asterix und Obelix in eine Kirschblütenlandschaft vor dem Fujiyama zu platzieren, wäre wohl angreifbar (außer, die Schranke des § 51 a UrhG griffe ein, wonach ein fremdes Werk „zum Zweck der Karikatur, der Parodie und des Pastiches“ benutzt werden darf).
4. Urheber- und sonstige Persönlichkeitsrechte
a) Urheberpersönlichkeitsrecht:
Das Gesetz schützt den Urheber nicht nur in vermögensrechtlicher Hinsicht (Verwertungsrechte), sondern auch hinsichtlich der geistigen und persönlichen Beziehungen zu seinem Werk (Urheberpersönlichkeitsrecht). Dazu gehören die Rechte auf Anerkennung seiner Urheberschaft an seinem Werk und auf Unterlassung von Entstellungen oder gar Verunglimpfungen. Es liegt auf der Hand, dass die Handhabung von KI auch insoweit zu gravierenden Beeinträchtigungen führen kann – immer vorausgesetzt, das Ausgangswerk bleibt erkennbar.
b) Sonstige Persönlichkeitsrechte:
aa)
Spezielle Schutztatbestände gibt es z.B. hinsichtlich der Privatsphäre, des Namens, der Ehre und des Rechts am eigenen Bild.
bb)
Darüber hinaus hat die Rechtsprechung gestützt auf die grundgesetzlich gewährleistete Menschenwürde und die freie Entfaltung der Persönlichkeit ein allgemeines Persönlichkeitsrecht entwickelt.
Keine Urheber-, aber Persönlichkeitsrechte sind z.B. betroffen, wenn sich die KI individuelle menschliche Stimmen aneignet und imitiert. Stimmen können inzwischen mit relativ geringem Trainingsaufwand und Ausgangsmaterial geklont werden. So waren zwei U.S.-Rapper mehr als erstaunt, als sie sich im Duett ein Stück singen hörten, das sie weder kannten noch je gesungen hatten – geschweige denn im Duett. Nach deutschem Recht wäre das eine eklatante Verletzung ihrer Persönlichkeitsrechte. Außerdem werden natürlich die Hörer getäuscht. Der Song wurde binnen kürzester Zeit hunderttausendfach gestreamt, bis der Verleger des einen Künstlers dieses Treiben unterband.