Warum Sie bei der Verwendung von DALLE-2- und Midjourney-Bildern für kommerzielle Zwecke vorsichtig sein sollten
Veröffentlicht: 2022-07-29Als die Firma Open AI ihre neue und kostenpflichtige Version des KI-Tools DALLE-2 auf den Markt brachte, tat sich auch etwas bei den Lizenzbedingungen. In diesem kurzen Beitrag erklären wir, warum wir neue Fortschritte in der Text-zu-Bild-Generierungstechnologie lieben, aber warum wir Sie auch dazu ermutigen, vorsichtig zu sein, wenn Sie vorhaben, eines dieser Bilder für kommerzielle Zwecke zu verwenden.
DALLE 2 ist nur eine von vielen neuen Plattformen, die Ihnen Zugang zu KI-generierten Inhalten bieten und behaupten, dass Sie diese für kommerzielle Zwecke nutzen können. Andere Plattformen sind Midjourney, Jasper Art, Nightcafe, Starry AI und Craiyon. Wir werden uns in diesem Blogbeitrag auf Dalle 2 konzentrieren, aber sie sind fast identisch, wenn es um die rechtlichen Herausforderungen und Probleme geht.
Die in DALLE 2 verwendete Technologie (sorry, wenn das ein bisschen geeky wird )
Haben Sie schon von DALLE 2 von Open-AI gehört? Das KI-Tool, das auf magische Weise Bilder aus Text erstellt. Wenn ja, dann müssen Sie dies auch lesen …
An der Oberfläche scheint es ziemlich erstaunlich. Bitten Sie DALLE, ein Foto eines Flugbegleiters zu erstellen, und Sie erhalten Folgendes:
Quelle: DALL·E 2 (openai.com)
Einige haben argumentiert, dass zu viele der DALLE-2-Ergebnisse stereotyp und voreingenommen sind, aber das ist hier nicht das eigentliche Problem. Das eigentliche Problem ist die Legalität dieser Bilder.
Einige der erstellten Bilder sind so nah an Old-School-Fotos, wie Sie nur bekommen können, und das aus einem bestimmten Grund. Auch wenn Open AI sich weigert, alle Datensätze offenzulegen, die sie zum Trainieren ihrer KI verwendet haben, ist klar, dass diese Bilder keine künstlerische KI sind, die sich vorstellt, wie ein Flugbegleiter aussehen würde. Es sind alte Bilddatenbanken und schlechte Stock-Fotos, die fast 1:1 nachgebaut sind.
Wenn Sie sich die Dokumentation von DALLE-2 genauer ansehen, finden Sie eine Reihe von Forschungsarbeiten:
[2204.06125] Hierarchische textbedingte Bilderzeugung mit CLIP Latents (arxiv.org)
[2112.10741] GLIDE: Auf dem Weg zur fotorealistischen Bilderzeugung und -bearbeitung mit textgeführten Diffusionsmodellen (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf
Laut den Papieren ist der einzige öffentliche Datensatz (es könnte mehr geben, den das Unternehmen nicht öffentlich veröffentlichen möchte), der zum Trainieren von DALLE 2 verwendet wurde, der sogenannte COCO-Datensatz.
Dies ist ein Datensatz, der im Rahmen eines von Microsoft und anderen gesponserten Projekts gesammelt wurde. Tut mir leid, dass ich jetzt etwas technisch werde, aber der Datensatz besteht aus zwei Dingen:
1) Die Anmerkungen zu den Bildern. Eine Anmerkung bedeutet im Grunde eine Anmerkung, Text und/oder Beschreibung, die jedem Bild hinzugefügt wird. Diese Anmerkungen wurden unter der sogenannten Creative Commons Attribution 4.0 License veröffentlicht.
2) Die Bilder selbst. Diese Bilder gehören NICHT zum COCO-Projekt. Sie stammen von Flickr und müssen sich daher an die Nutzungsbedingungen von Flickr halten.
Und wie es auf der Website heißt: „Die Benutzer der Bilder übernehmen die volle Verantwortung für die Verwendung des Datensatzes, einschließlich, aber nicht beschränkt auf die Verwendung von Kopien urheberrechtlich geschützter Bilder, die sie möglicherweise aus dem Datensatz erstellen.“
Was bedeutet das also für Sie als normaler Nutzer von Fotos, Videos etc. und für Ihr tägliches Marketing und Ihre Kommunikation? Sie müssen vorsichtig sein und zweimal überlegen!
Von offen und kostenlos bis geschlossen und bezahlt
Die rechtlichen Probleme sind potenziell massiv. Jetzt, da DALLE-2 von offen und kostenlos zu geschlossen und kostenpflichtig geändert wurde, haben sie auch ihre Bedingungen geändert, sodass …
„Sie können alle Bilder, die Sie erstellen, für alle kommerziellen Zwecke verwenden.“
Das ist natürlich eine ziemlich gewagte Aussage, aber wenn Sie die Öffentlichkeit davon überzeugen können, dass diese KI eher mit einem kreativen Künstler verglichen werden sollte als mit einer Photoshop-bearbeitenden Person, die sich mehr als nur von vorhandenen Stock-Fotos inspirieren lässt, könnte es funktionieren, oder?
Betrachtet man jedoch die Ausgabe, wenn es um Menschen und realistische Bilder geht, ist hier kein kreativer Künstler am Werk. Dies sind bearbeitete Replikationen von Datensätzen, die nicht für kommerzielle Zwecke wie oben beschrieben verwendet werden dürfen.
Was sagen die Experten?
Als der Anwalt und IP-Experte Bradley J. Hulbert nach seiner Meinung gefragt wurde, sagte er in einem Interview mit TechCrunch Folgendes:
„Bildgenerierende KI skaliert das Problem der Urheberrechtsverletzung enorm, weil sie die Eintrittsbarriere senkt.“
Systeme wie DALL-E 2 Quellen / geschabte Bilder von unzähligen öffentlichen Websites, und es gibt keinen direkten Präzedenzfall in den USA, der öffentlich zugängliche Daten als faire Nutzung bestätigt. Die rechtlichen Probleme gelten also sowohl für die generierten Bilder als auch für den Datensatz, mit dem sie trainiert werden.
„Es gibt große Probleme mit den Rechten an den Bildern und den Personen, Orten und Objekten in den Bildern, auf denen Modelle wie DALL-E 2 trainiert werden.“
Als weiteres Beispiel ist hier das neue DALLE, das Bilder eines Anwalts „erstellt“:
Quelle: DALL·E 2 (openai.com)
Abgesehen von Vorurteilen und Stereotypen ist es ziemlich offensichtlich, wie sehr diese Bilder denen ähneln, die Sie auf einer altmodischen Foto-Website oder den kostenlosen Bilddaten-Trainingssets finden würden, die im Internet verfügbar sind (obwohl sie nicht verwendet werden sollen). gewerbliche Zwecke).
In den zuvor erwähnten Datensätzen haben die Bilder möglicherweise eine Creative Commons-Lizenz für ihre Anmerkungen und eine Flickr-Lizenz für die Bilder selbst, aber sie haben nicht das, was in der Bildbranche als Modell- und Eigentumsfreigaben bekannt ist.
Dies bedeutet im Grunde, dass die Personen auf den Bildern NICHT der Verwendung für kommerzielle Zwecke jeglicher Art zugestimmt haben, sodass die Verwendung der Bilder für solche Zwecke möglicherweise rechtliche Probleme verursachen würde und Sie am Ende einen Brief wegen Urheberrechtsverletzung erhalten würden.
Sie sind in keiner Weise versichert, seien Sie also vorsichtig
Was passiert also, wenn Sie diese Bilder kombinieren, um daraus neue Bilder zu machen? Verschwindet das rechtliche Problem? Offensichtlich nicht. Es ist vielleicht schwieriger zu dokumentieren, aber es ist immer noch ein Problem.
Aus all diesen Gründen raten wir Ihnen, sehr vorsichtig zu sein, wenn Sie KI-generierte Bilder wie diese für kommerzielle Zwecke verwenden. Das bedeutet für Ihren Newsletter, Blog, Ihre Website, Marketingkampagnen, Pitch Decks und überall sonst, wo Sie über Ihr Unternehmen kommunizieren.
Sie sind in keiner Weise rechtlich geschützt; Sie haben keine Versicherung, wie Sie es bei JumpStory tun, und wenn Sie in Schwierigkeiten geraten, wird DALLE Ihnen nicht helfen.
Nutzen Sie diese neue und unterhaltsame Technologie für das, was sie ist – Spaß –, aber gehen Sie kein Risiko ein, wenn es um Ihr Geschäft geht.