kreativ[ge]recht   /     DĂŒrfen KI-Bildgeneratoren mit meinen Bildern trainiert werden?

Description

KI-Bildgeneratoren werden in der Regel mit maschinellen Lernverfahren trainiert, insbesondere mit neuronalen Netzen. Hierbei wird ein großer Datensatz mit Bildern verwendet, um das Modell zu trainieren. Die Erstellung dieses Datensatzes dĂŒrfte nach deutscher Rechtslage im Moment der einzige AnknĂŒpfungspunkt fĂŒr Urheber*innen sein, um gegen die Verwendung Ihrer Werke zu Trainingszwecken vorzugehen.   Das Trainingsverfahren beginnt damit, dass das Modell mit einer Vielzahl von Bildern gefĂŒttert wird, zusammen mit den entsprechenden Klassifizierungen oder Labels. Das Modell verwendet dann einen Algorithmus, um die Muster in den Bildern zu identifizieren und eine Beziehung zwischen den Eingabebildern und den Labels herzustellen. Nach dem Training kann das Modell dann neue Bilder erzeugen, indem es aufgrund seiner gelernten Muster Vorhersagen trifft. Die Genauigkeit des Modells hĂ€ngt von der QualitĂ€t und GrĂ¶ĂŸe des Trainingsdatensatzes sowie der Architektur des Modells ab. Nach der aktuell wohl vorherrschenden Ansicht ist in der Zusammenstellung des Datasets, an dem die kĂŒnstliche Intelligenz trainiert wird, eine urheberrechtlich relevante Handlung in Form einer VervielfĂ€ltigung nach § 16 UrhG zu sehen. Dies dĂŒrfte im Moment also der (vermutlich einzige?) Punkt sein, an dem Urheber*innen einhaken können, deren Bilder ungefragt zu Trainingszwecken genutzt wurden. Handelt es sich um eine solche urheberrechtlich relevante Nutzung, mĂŒssten die verarbeitenden Unternehmen eine Lizenz an den jeweiligen Bildern einholen. Mit der letzten Urheberrechtsnovelle haben nun aber auch zwei Schrankenbestimmungen Einzug ins UrhG gefunden, die gerade diese Art der VervielfĂ€ltigung (auch “Data Mining” genannt) erlauben sollen. Data Mining ist das automatisierte Verarbeiten und Analysieren von Daten. Die Vorschrift des § 44b UrhG erlaubt mit gewissen EinschrĂ€nkungen jegliche Form des Data Mining. Also auch kommerzieller Natur:  Ҥ 44b Text und Data Mining  (1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere ĂŒber Muster, Trends und Korrelationen zu gewinnen.  (2) ZulĂ€ssig sind VervielfĂ€ltigungen von rechtmĂ€ĂŸig zugĂ€nglichen Werken fĂŒr das Text und Data Mining. Die VervielfĂ€ltigungen sind zu löschen, wenn sie fĂŒr das Text und Data Mining nicht mehr erforderlich sind.  (3) Nutzungen nach Absatz 2 Satz 1 sind nur zulĂ€ssig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugĂ€nglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.”  Schließlich sieht § 60d UrhG vor, dass Data Mining zum Zwecke der wissenschaftlichen Forschung sogar im Falle eines solchen Nutzungsvorbehalts legal sein soll:   Ҥ 60d Text und Data Mining fĂŒr Zwecke der wissenschaftlichen Forschung  (1) VervielfĂ€ltigungen fĂŒr Text und Data Mining (§ 44b Absatz 1 und 2 Satz 1) sind fĂŒr Zwecke der wissenschaftlichen Forschung nach Maßgabe der nachfolgenden Bestimmungen zulĂ€ssig.  (2) Zu VervielfĂ€ltigungen berechtigt sind Forschungsorganisationen. Forschungsorganisationen sind Hochschulen, Forschungsinstitute oder sonstige Einrichtungen, die wissenschaftliche Forschung betreiben, sofern sie   (3) Zu VervielfĂ€ltigungen berechtigt sind ferner   1.Bibliotheken und Museen, sofern sie öffentlich zugĂ€nglich sind, sowie Archive und Einrichtungen im Bereich des Film- oder Tonerbes (Kulturerbe-Einrichtungen),  2.einzelne Forscher, sofern sie nicht kommerzielle Zwecke verfolgen.  (4) Berechtigte nach den AbsĂ€tzen 2 und 3, die nicht kommerzielle Zwecke verfolgen, dĂŒrfen VervielfĂ€ltigungen nach Absatz 1 folgenden Personen öffentlich zugĂ€nglich machen:   1.einem bestimmt abgegrenzten Kreis von Personen fĂŒr deren gemeinsame wissenschaftliche Forschung sowie  2.einzelnen Dritten zur ÜberprĂŒfung der QualitĂ€t wissenschaftlicher Forschung.  Sobald die gemeinsame wissenschaftliche Forschung oder die ÜberprĂŒfung der QualitĂ€t wissenschaftlicher Forschung abgeschlossen ist, ist die öffentliche ZugĂ€nglichmachung zu beenden.  (5) Berechtigte nach den AbsĂ€tzen 2 und 3 Nummer 1 dĂŒrfen VervielfĂ€ltigungen nach Absatz 1 mit angemessenen Sicherheitsvorkehrungen gegen unbefugte Benutzung aufbewahren, solange sie fĂŒr Zwecke der wissenschaftlichen Forschung oder zur ÜberprĂŒfung wissenschaftlicher Erkenntnisse erforderlich sind.  (6) Rechtsinhaber sind befugt, erforderliche Maßnahmen zu ergreifen, um zu verhindern, dass die Sicherheit und IntegritĂ€t ihrer Netze und Datenbanken durch VervielfĂ€ltigungen nach Absatz 1 gefĂ€hrdet werden.”  Im Moment scheinen sich Einrichtungen wie LAION, welche Datasets zusammenstellen, eher auf § 60d UrhG zu berufen, da die Außenwirkung den Forschungszweck stark in den Vordergrund stellt. Ob gerade die Weitergabe an die kommerziell tĂ€tigen Anbieter von Bildgeneratoren hiervon noch gedeckt wird, wird die Zukunft und vor allem die zu erwartende Rechtsprechung zeigen mĂŒssen. Bis dahin können Urheber*innen leider wenig dagegen unternehmen, dass Ihre Bildinhalte als Trainingsdaten genutzt werden. Auch wenn es ĂŒber Anbieter wie https://haveibeentrained.com/ möglich ist, eigene Bilder in großen Datasets zu identifizieren, stellt sich die Frage, was man als Urheber*in mit dieser Information anfangen kann. Bis auf das Setzen des oben genannten Nutzungsvorbehaltes auf der eigenen Website, welcher bestenfalls dazu fĂŒhren wĂŒrde, dass die eigenen Bilder nicht mehr zu kommerziellen Trainingszwecken genutzt werden dĂŒrfen, bleibt den Urheber*innen im Wesentlichen nur das Abwarten auf Rechtsprechung und Gesetzgebung. Daher sind wir der Auffassung, dass es aktuell fĂŒr Urheber*innen deutlich mehr Sinn machen dĂŒrfte, sich zukunftsorientiert mit dem Thema der kĂŒnstlichen Intelligenz auseinanderzusetzen, da es im Moment eher unwahrscheinlich scheint, dass durch rechtliches Vorgehen gegen potentiell unrechtmĂ€ĂŸig zusammengesetzte Datasets die Entwicklung der kĂŒnstlichen Intelligenz und ihr damit verbundener Einzug in den Berufsalltag von Kreativen zu stoppen sein dĂŒrfte.

Subtitle
KI-Bildgeneratoren werden in der Regel mit maschinellen Lernverfahren trainiert, insbesondere mit neuronalen Netzen. Hierbei wird ein großer Datensatz mit Bildern verwendet, um das Modell zu trainieren. Die Erstellung dieses Datensatzes dĂŒrfte nach...
Duration
26:23
Publishing date
2023-02-01 08:40
Link
https://deubelli.libsyn.com/drfen-ki-bildgeneratoren-mit-meinen-bildern-trainiert-werden
Contributors
Enclosures
https://traffic.libsyn.com/secure/deubelli/KI_Trainingsdaten.mp3?dest-id=458184
audio/mpeg

Shownotes

KI-Bildgeneratoren werden in der Regel mit maschinellen Lernverfahren trainiert, insbesondere mit neuronalen Netzen. Hierbei wird ein großer Datensatz mit Bildern verwendet, um das Modell zu trainieren. Die Erstellung dieses Datensatzes dĂŒrfte nach deutscher Rechtslage im Moment der einzige AnknĂŒpfungspunkt fĂŒr Urheber*innen sein, um gegen die Verwendung Ihrer Werke zu Trainingszwecken vorzugehen.  

Das Trainingsverfahren beginnt damit, dass das Modell mit einer Vielzahl von Bildern gefĂŒttert wird, zusammen mit den entsprechenden Klassifizierungen oder Labels. Das Modell verwendet dann einen Algorithmus, um die Muster in den Bildern zu identifizieren und eine Beziehung zwischen den Eingabebildern und den Labels herzustellen.

Nach dem Training kann das Modell dann neue Bilder erzeugen, indem es aufgrund seiner gelernten Muster Vorhersagen trifft. Die Genauigkeit des Modells hĂ€ngt von der QualitĂ€t und GrĂ¶ĂŸe des Trainingsdatensatzes sowie der Architektur des Modells ab.

Nach der aktuell wohl vorherrschenden Ansicht ist in der Zusammenstellung des Datasets, an dem die kĂŒnstliche Intelligenz trainiert wird, eine urheberrechtlich relevante Handlung in Form einer VervielfĂ€ltigung nach § 16 UrhG zu sehen. Dies dĂŒrfte im Moment also der (vermutlich einzige?) Punkt sein, an dem Urheber*innen einhaken können, deren Bilder ungefragt zu Trainingszwecken genutzt wurden. Handelt es sich um eine solche urheberrechtlich relevante Nutzung, mĂŒssten die verarbeitenden Unternehmen eine Lizenz an den jeweiligen Bildern einholen.

Mit der letzten Urheberrechtsnovelle haben nun aber auch zwei Schrankenbestimmungen Einzug ins UrhG gefunden, die gerade diese Art der VervielfĂ€ltigung (auch “Data Mining” genannt) erlauben sollen. Data Mining ist das automatisierte Verarbeiten und Analysieren von Daten.

Die Vorschrift des § 44b UrhG erlaubt mit gewissen EinschrÀnkungen jegliche Form des Data Mining. Also auch kommerzieller Natur: 

“§ 44b Text und Data Mining 

(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere ĂŒber Muster, Trends und Korrelationen zu gewinnen. 

(2) ZulĂ€ssig sind VervielfĂ€ltigungen von rechtmĂ€ĂŸig zugĂ€nglichen Werken fĂŒr das Text und Data Mining. Die VervielfĂ€ltigungen sind zu löschen, wenn sie fĂŒr das Text und Data Mining nicht mehr erforderlich sind. 

(3) Nutzungen nach Absatz 2 Satz 1 sind nur zulĂ€ssig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugĂ€nglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.” 

Schließlich sieht § 60d UrhG vor, dass Data Mining zum Zwecke der wissenschaftlichen Forschung sogar im Falle eines solchen Nutzungsvorbehalts legal sein soll:  

Ҥ 60d Text und Data Mining fĂŒr Zwecke der wissenschaftlichen Forschung 

(1) VervielfĂ€ltigungen fĂŒr Text und Data Mining (§ 44b Absatz 1 und 2 Satz 1) sind fĂŒr Zwecke der wissenschaftlichen Forschung nach Maßgabe der nachfolgenden Bestimmungen zulĂ€ssig. 

(2) Zu VervielfÀltigungen berechtigt sind Forschungsorganisationen. Forschungsorganisationen sind Hochschulen, Forschungsinstitute oder sonstige Einrichtungen, die wissenschaftliche Forschung betreiben, sofern sie  

(3) Zu VervielfÀltigungen berechtigt sind ferner  

1.Bibliotheken und Museen, sofern sie öffentlich zugÀnglich sind, sowie Archive und Einrichtungen im Bereich des Film- oder Tonerbes (Kulturerbe-Einrichtungen), 

2.einzelne Forscher, sofern sie nicht kommerzielle Zwecke verfolgen. 

(4) Berechtigte nach den AbsĂ€tzen 2 und 3, die nicht kommerzielle Zwecke verfolgen, dĂŒrfen VervielfĂ€ltigungen nach Absatz 1 folgenden Personen öffentlich zugĂ€nglich machen:  

1.einem bestimmt abgegrenzten Kreis von Personen fĂŒr deren gemeinsame wissenschaftliche Forschung sowie 

2.einzelnen Dritten zur ÜberprĂŒfung der QualitĂ€t wissenschaftlicher Forschung. 

Sobald die gemeinsame wissenschaftliche Forschung oder die ÜberprĂŒfung der QualitĂ€t wissenschaftlicher Forschung abgeschlossen ist, ist die öffentliche ZugĂ€nglichmachung zu beenden. 

(5) Berechtigte nach den AbsĂ€tzen 2 und 3 Nummer 1 dĂŒrfen VervielfĂ€ltigungen nach Absatz 1 mit angemessenen Sicherheitsvorkehrungen gegen unbefugte Benutzung aufbewahren, solange sie fĂŒr Zwecke der wissenschaftlichen Forschung oder zur ÜberprĂŒfung wissenschaftlicher Erkenntnisse erforderlich sind. 

(6) Rechtsinhaber sind befugt, erforderliche Maßnahmen zu ergreifen, um zu verhindern, dass die Sicherheit und IntegritĂ€t ihrer Netze und Datenbanken durch VervielfĂ€ltigungen nach Absatz 1 gefĂ€hrdet werden.” 

Im Moment scheinen sich Einrichtungen wie LAION, welche Datasets zusammenstellen, eher auf § 60d UrhG zu berufen, da die Außenwirkung den Forschungszweck stark in den Vordergrund stellt. Ob gerade die Weitergabe an die kommerziell tĂ€tigen Anbieter von Bildgeneratoren hiervon noch gedeckt wird, wird die Zukunft und vor allem die zu erwartende Rechtsprechung zeigen mĂŒssen.

Bis dahin können Urheber*innen leider wenig dagegen unternehmen, dass Ihre Bildinhalte als Trainingsdaten genutzt werden. Auch wenn es ĂŒber Anbieter wie https://haveibeentrained.com/ möglich ist, eigene Bilder in großen Datasets zu identifizieren, stellt sich die Frage, was man als Urheber*in mit dieser Information anfangen kann.

Bis auf das Setzen des oben genannten Nutzungsvorbehaltes auf der eigenen Website, welcher bestenfalls dazu fĂŒhren wĂŒrde, dass die eigenen Bilder nicht mehr zu kommerziellen Trainingszwecken genutzt werden dĂŒrfen, bleibt den Urheber*innen im Wesentlichen nur das Abwarten auf Rechtsprechung und Gesetzgebung.

Daher sind wir der Auffassung, dass es aktuell fĂŒr Urheber*innen deutlich mehr Sinn machen dĂŒrfte, sich zukunftsorientiert mit dem Thema der kĂŒnstlichen Intelligenz auseinanderzusetzen, da es im Moment eher unwahrscheinlich scheint, dass durch rechtliches Vorgehen gegen potentiell unrechtmĂ€ĂŸig zusammengesetzte Datasets die Entwicklung der kĂŒnstlichen Intelligenz und ihr damit verbundener Einzug in den Berufsalltag von Kreativen zu stoppen sein dĂŒrfte.