Ein Begriff, der eng mit der künstlichen Intelligenz (KI) verknüpft ist, lautet Large Language Model (LLM). Ein solches maschinelle Lernmodell generiert Texte. Bekannt sind GPT-n von OpenAI oder auch Gemini von Google. Damit das Sprachmodell etwas Sinnvolles ausspuckt, braucht es allerdings Training. Für dieses Training eignen sich von Menschen verfasste Texte – immerhin sollen die generierten Sätze am Ende menschlich klingen. Warum also nicht einfach alles verwerten, was das Internet so hergibt? Texte von Blogs, News-Artikel von Websites, ganze Romane im E-Book-Format? Penguin Random House findet gerade den letzten Punkt wohl gar nicht witzig und schiebt einen Riegel vor.

Random House mit neuen Copyright-Hinweisen

Wie das britische Fachmagazin The Bookseller exklusiv berichtet, ergänzt Penguin Random House wohl die Copyright-Angaben. Dadurch soll ein Training von KI mit Autoren-Werken verhindert werden. Der neue Wortlaut: “Kein Teil dieses Buches darf in irgendeiner Weise zum Trainieren von Technologien oder Systemen der künstlichen Intelligenz verwendet oder vervielfältigt werden.” Nicht nur neue, sondern auch nachgedruckte Titel sollen den Hinweis enthalten. In der Erklärung findet sich auch die Anmerkung, dass die Titel “ausdrücklich von der Ausnahmeregelung für Text- und Data-Mining ausgenommen sind”. Laut dem Wochenmagazin für den Deutschen Buchhandel Börsenblatt erlaubt in Europa Artikel 4 Absatz 1 der Datenschutz-Richtlinie, die Nutzung urheberrechtlich geschützter Werke für Text und Data Mining (Auswertung großer Datenmengen), denn dabei werden nur semantische Informationen verarbeitet. Im Gegensatz dazu steht das Training generativer KI-Modelle, denn die Technologie “extrahiert und verwertet umfangreich die syntaktischen und damit urheberrechtlich geschützten Informationen der Werke in den Trainingsdaten.” KI-Training sei laut einem Gutachten eine Urheberrechtsverletzung (Stand: 6. September 2024).

Einsatz von KI nicht ausgeschlossen

Mit Penguin Random House wehrt sich einer der großen englischsprachigen Publikumsverlage gegen eine Verwendung der Werke zum Trainieren von Sprachmodellen. Ganz schließt man die Anwendung von KI aber nicht aus. Der Geschäftsführer von Penguin Random House UK, Tom Weldon, erklärte demnach im August 2024 gegenüber den Mitarbeitenden, das Unternehmen werde “das geistige Eigentum unserer Autoren und Künstler energisch verteidigen”, es werde aber selbst “generative KI-Tools selektiv und verantwortungsbewusst einsetzen”, wenn dafür der Bedarf im Unternehmen da ist.

Penguin Random House dennoch beispielhaft

Die Authors’ Licensing and Collecting Society äußert sich positiv zur Aktualisierung von Penguin Random House. Geschäftsführerin Barbara Hayes sagt: “Es ist erfreulich, dass große Verlage wie PRH neue Formulierungen (…) aufnehmen, die den Grundsatz des Urheberrechts bekräftigen und Technologieunternehmen ausdrücklich untersagen, urheberrechtlich geschützte Werke zum Trainieren ihrer KI-Modelle zu verwenden. Wir hoffen, dass mehr Verlage dem Beispiel von PRH folgen und dass die Unternehmen, die solche Modelle entwickeln, dies dringend zur Kenntnis nehmen.”

Gewerkschaft fordert Zustimmung der Autoren

Die britische Schriftstellergewerkschaft Society of Authors (SoA) nannte die Änderung der Urheberrechtsseite als “willkommenen Schritt”. Die derzeitige Formulierung gehe aber noch nicht weit genug. Entsprechendes müsste sich auch in den Autorenverträgen wiederfinden. Anna Ganley, Geschäftsführerin der SoA, sagt: “Zusätzlich zu dieser Änderung hoffen wir nun auch auf Änderungen in den Verlagsverträgen (…), da wir es für ebenso wichtig halten, dass die Verlage den Urhebern garantieren, dass ihre Zustimmung eingeholt wird, bevor der Verlag generative KI in Verbindung mit der Produktion des Werks einsetzt oder deren Einsatz zulässt – zum Beispiel für (…) Übersetzungen, Bilder, Coverdesign – und bevor der Verlag einem KI-System Zugang zu dem Werk oder dessen Nutzung gewährt.”

Categories: Uncategorized

Call Now Button