Dlaczego należy zachować ostrożność podczas używania obrazów Dalle-2 i Midjourney do celów komercyjnych

Opublikowany: 2022-07-29

Kiedy firma Open AI wypuściła swoją nową i płatną wersję narzędzia AI-tool DALLE-2, coś się stało również z ich warunkami licencyjnymi. W tym krótkim poście wyjaśniamy, dlaczego uwielbiamy nowe postępy w technologii generowania tekstu na obraz, ale także dlaczego zachęcamy do zachowania ostrożności, jeśli planujesz wykorzystać którykolwiek z tych obrazów do celów komercyjnych.

DALLE 2 to tylko jedna z wielu nowych platform oferujących dostęp do treści generowanych przez sztuczną inteligencję i twierdzących, że możesz ich używać do celów komercyjnych. Inne platformy to Midjourney, Jasper Art, Nightcafe, Starry AI i Craiyon. W tym poście skupimy się na Dalle 2, ale są one prawie identyczne, jeśli chodzi o wyzwania prawne i problemy.

Spis treści

Technologia zastosowana w DALLE 2 (przepraszam, jeśli stanie się to trochę geekowe) )

Czy słyszałeś o DALLE 2 od Open-AI? Narzędzie AI, które w magiczny sposób tworzy obrazy z tekstu. Jeśli tak, to też musisz to przeczytać…

Na pierwszy rzut oka wydaje się to niesamowite. Poproś DALLE o wygenerowanie zdjęcia stewardesy, a oto, co otrzymasz:

źródło: DALL·E 2 (openai.com)

Niektórzy twierdzą, że zbyt wiele wyników DALLE-2 to stereotypy i uprzedzenia, ale to nie jest prawdziwy problem. Prawdziwym problemem jest legalność tych obrazów.

Niektóre z utworzonych obrazów są tak bliskie starej szkole, jak to tylko możliwe, i nie bez powodu. Chociaż Open AI odmawia ujawnienia wszystkich zestawów danych, których używali do trenowania swojej sztucznej inteligencji, jasne jest, że te obrazy nie są artystyczną sztuczną inteligencją wyobrażającą sobie, jak wyglądałaby stewardesa. Są to stare bazy danych obrazów i kiepskie zdjęcia stockowe, prawie replikowane w skali 1:1.

Jeśli zajrzysz głębiej w dokumentację DALLE-2, znajdziesz kilka artykułów naukowych:
[2204.06125] Hierarchiczne generowanie obrazu warunkowego tekstu z ukrytymi elementami CLIP (arxiv.org)
[2112.10741] GLIDE: W kierunku fotorealistycznego generowania i edycji obrazu za pomocą modeli dyfuzji sterowanych tekstem (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf

Według dokumentów, jedynym publicznym zbiorem danych (może być więcej, którego firma nie chce publikować publicznie), który został wykorzystany do szkolenia DALLE 2, jest tak zwany zbiór danych COCO.

Jest to zestaw danych zebrany w ramach projektu sponsorowanego przez firmę Microsoft i inne firmy. Przepraszam, że teraz jestem trochę techniczny, ale zbiór danych składa się z dwóch rzeczy:

1) Adnotacje na zdjęciach. Adnotacja oznacza w zasadzie notatkę, tekst i/lub opis dodany do każdego obrazu. Te adnotacje zostały wydane na tak zwanej licencji Creative Commons Attribution 4.0.

2) Same obrazy. Te obrazy NIE należą do projektu COCO. Zostały one pozyskane z serwisu Flickr i dlatego muszą być zgodne z Warunkami korzystania z serwisu Flickr.

I jak napisano na stronie internetowej: „Użytkownicy obrazów przyjmują pełną odpowiedzialność za wykorzystanie zbioru danych, w tym między innymi za wykorzystanie wszelkich kopii obrazów chronionych prawem autorskim, które mogą utworzyć na podstawie zbioru danych”.

Co to oznacza dla Ciebie jako zwykłego użytkownika zdjęć, filmów itp. oraz dla Twojego codziennego marketingu i komunikacji? Musisz być ostrożny i dwa razy się zastanowić!

Od otwartych i bezpłatnych po zamknięte i płatne

Kwestie prawne są potencjalnie ogromne. Teraz, gdy DALLE-2 zmieniło się z otwartego i bezpłatnego na zamknięte i płatne, zmienili również swoje warunki, aby ...

„Możesz wykorzystać wszystkie wygenerowane obrazy do wszelkich celów komercyjnych”.

To oczywiście dość odważne stwierdzenie, ale jeśli przekonasz opinię publiczną, że tę sztuczną inteligencję należy porównać do kreatywnego artysty, a nie osoby edytującej Photoshopa, która czerpie więcej niż inspirację z istniejących zdjęć stockowych, może to zadziałać, prawda?

Jednak patrząc na twórczość, jeśli chodzi o ludzi i realistyczne obrazy, nie jest to artysta twórczy w pracy. To edytowane repliki zbioru danych, których nie wolno używać do celów komercyjnych, jak opisano powyżej.

Co mówią eksperci?

Kiedy prawnik i ekspert ds. własności intelektualnej Bradley J. Hulbert został zapytany o jego opinię, tak powiedział TechCrunch w wywiadzie:

„Sztuczna inteligencja generująca obrazy znacznie zmniejsza problem naruszenia praw autorskich, ponieważ obniża barierę wejścia”.

Systemy takie jak DALL-E 2 zawierają źródła/pobierane obrazy z niezliczonych publicznych witryn internetowych, aw Stanach Zjednoczonych nie ma bezpośredniego precedensu prawnego, w którym publicznie dostępne dane są traktowane jako dozwolony użytek. Tak więc kwestie prawne dotyczą zarówno generowanych obrazów, jak i zbioru danych wykorzystywanych do ich szkolenia.

„Istnieją duże problemy z prawami do zdjęć oraz osobami, miejscami i obiektami na zdjęciach, na których trenowane są modele takie jak DALL-E 2”.

Jako kolejny przykład, oto nowe „tworzenie” obrazów prawnika przez firmę DALLE:

źródło: DALL·E 2 (openai.com)

Ponownie, odkładając na bok uprzedzenia i stereotypy, jest całkiem oczywiste, jak bardzo te obrazy przypominają te, które można znaleźć na staromodnej stronie internetowej ze zdjęciami stockowymi lub bezpłatnymi zestawami szkoleniowymi z danymi graficznymi, które są dostępne w Internecie (chociaż nie można ich używać do komercyjne cele).

W zbiorach danych, o których wspomnieliśmy wcześniej, obrazy mogą mieć licencję Creative Commons na adnotacje i licencję Flickr na same obrazy, ale nie mają tego, co w branży obrazów jest znane jako zgody na rozpowszechnianie wizerunku i własności.

Zasadniczo oznacza to, że ludzie na obrazach NIE zostali zatwierdzeni do wykorzystania w jakichkolwiek celach komercyjnych, więc wykorzystanie obrazów do takich celów może potencjalnie spowodować problemy prawne i w efekcie otrzymasz pismo o naruszeniu praw autorskich.

Nie jesteś w żaden sposób ubezpieczony, więc bądź ostrożny

A więc co się dzieje, gdy połączysz te obrazy, aby przekształcić się w nowe obrazy? Czy problem prawny znika? Oczywiście, że nie. Dokumentacja może być trudniejsza, ale nadal jest to problem.

Z tych wszystkich powodów radzimy być bardzo ostrożnym podczas korzystania z obrazów generowanych przez sztuczną inteligencję, takich jak te w celach komercyjnych. Oznacza to dla biuletynu, bloga, strony internetowej, kampanii marketingowych, prezentacji i wszędzie tam, gdzie komunikujesz się o swojej firmie.

Nie jesteś prawnie chroniony w żaden sposób; nie masz ubezpieczenia, tak jak w JumpStory, a jeśli wpadniesz w kłopoty, DALLE ci nie pomoże.

Używaj tej nowej i zabawnej technologii do tego, czym jest – do zabawy – ale nie ryzykuj, gdy mówimy o Twojej firmie.

Dlaczego należy zachować ostrożność podczas używania obrazów Dalle-2 i Midjourney do celów komercyjnych

Technologia zastosowana w DALLE 2 (przepraszam, jeśli stanie się to trochę geekowe) )

Od otwartych i bezpłatnych po zamknięte i płatne

Co mówią eksperci?

Nie jesteś w żaden sposób ubezpieczony, więc bądź ostrożny

O autorze