De ce ar trebui să fiți atenți când utilizați imagini DALLE-2 și Midjourney în scopuri comerciale

Publicat: 2022-07-29

Când compania Open AI și-a lansat versiunea nouă și plătită a instrumentului AI DALLE-2, ceva sa întâmplat și cu termenii de licență. În această scurtă postare vă explicăm de ce ne plac noile progrese în tehnologia de generare a textului în imagine, dar de ce vă încurajăm și să fiți atenți dacă intenționați să utilizați oricare dintre aceste imagini în scopuri comerciale.

DALLE 2 este doar una dintre multele platforme noi care vă oferă acces la conținutul generat de AI și susțin că îl puteți utiliza în scopuri comerciale. Alte platforme includ Midjourney, Jasper Art, Nightcafe, Starry AI și Craiyon. Ne vom concentra asupra Dalle 2 în această postare pe blog, dar sunt aproape identice, când vine vorba de provocările și problemele legale.

Cuprins

Tehnologia folosită în DALLE 2 (îmi pare rău dacă aceasta devine un pic geek )

Ați auzit de DALLE 2 de la Open-AI? Instrumentul AI care creează în mod magic imagini din text. Dacă ai, atunci trebuie să citești și asta...

La suprafață pare destul de uimitor. Cereți lui DALLE să genereze o fotografie a unui însoțitor de bord și iată ce obțineți:

sursa: DALL·E 2 (openai.com)

Unii au susținut că prea multe dintre rezultatele DALLE-2 sunt stereotipuri și părtinitoare, dar nu aceasta este adevărata problemă aici. Adevărata problemă este legalitatea acestor imagini.

Unele dintre imaginile create sunt la fel de apropiate de fotografiile vechi de școală, pe cât puteți obține, și sunt așa cu un motiv. Chiar dacă Open AI refuză să dezvăluie toate seturile de date pe care le-au folosit pentru a-și antrena AI, este clar că aceste imagini nu sunt o IA artistică care să-și imagineze cum ar arăta un însoțitor de bord. Sunt baze de date vechi de imagini și fotografii de stoc proaste aproape replicate 1:1.

Dacă te uiți mai adânc în documentația DALLE-2, ceea ce vei găsi sunt o serie de lucrări de cercetare:
[2204.06125] Generare ierarhică de imagini condiționate de text cu latente CLIP (arxiv.org)
[2112.10741] GLIDE: spre generarea și editarea imaginilor fotorealiste cu modele de difuzie ghidate de text (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf

Potrivit lucrărilor, singurul set de date publice (s-ar putea să fie mai multe pe care compania nu dorește să le publice în public) care a fost folosit pentru a antrena DALLE 2 este așa-numitul set de date COCO.

Acesta este un set de date care a fost colectat ca parte a unui proiect sponsorizat de Microsoft și alții. Îmi pare rău că devin puțin tehnic acum, dar setul de date constă din două lucruri:

1) Adnotările pe imagini. O adnotare înseamnă practic o notă, text și/sau descriere adăugate fiecărei imagini. Aceste adnotări au fost lansate sub așa-numita licență Creative Commons Attribution 4.0.

2) Imaginile în sine. Aceste imagini NU aparțin proiectului COCO. Acestea au fost obținute de la Flickr și, prin urmare, trebuie să respecte Termenii de utilizare Flickr.

Și așa cum se spune pe site: „Utilizatorii imaginilor își asumă întreaga responsabilitate pentru utilizarea setului de date, inclusiv, dar fără a se limita la utilizarea oricăror copii ale imaginilor protejate prin drepturi de autor pe care le pot crea din setul de date.”

Deci, ce înseamnă asta pentru tine, ca utilizator normal de fotografii, videoclipuri etc. și pentru marketingul și comunicarea ta zilnică? Trebuie să fii atent și să te gândești de două ori!

De la deschis și gratuit la închis și plătit

Problemele juridice sunt potențial masive. Acum că DALLE-2 s-a schimbat de la deschis și gratuit la închis și plătit, și-au schimbat și condițiile, astfel încât...

„Puteți folosi toate imaginile pe care le generați în toate scopurile comerciale.”

Aceasta este, desigur, o declarație destul de îndrăzneață, dar dacă puteți convinge publicul că această inteligență artificială ar trebui să fie comparată cu un artist creativ, mai degrabă decât cu o persoană care editează Photoshop, care se inspiră mai mult decât din fotografiile de stoc existente, ar putea funcționa, nu?

Cu toate acestea, privind rezultatul, când vine vorba de oameni și imagini realiste, acesta nu este un artist creativ la lucru. Acestea sunt replicări editate ale setului de date care nu pot fi utilizate în scopuri comerciale, așa cum este descris mai sus.

Ce spun experții?

Când avocatul și expertul în IP Bradley J. Hulbert a fost întrebat despre părerea sa, iată ce i-a spus lui TechCrunch într-un interviu:

„AI care generează imagini amplifică considerabil problema încălcării drepturilor de autor, deoarece reduce bariera de intrare.”

Sisteme precum DALL-E 2 sursă / imagini răzuite de pe nenumărate site-uri web publice și nu există un precedent legal direct în SUA care să susțină datele disponibile public ca fiind o utilizare loială. Deci, problemele legale se aplică atât imaginilor generate, cât și setului de date folosit pentru a le antrena.

„Există probleme mari cu drepturile asupra imaginilor și asupra oamenilor, locurilor și obiectelor din imaginile pe care modelele precum DALL-E 2 sunt antrenate.”

Ca un alt exemplu, iată noul DALLE care „creează” imagini ale unui avocat:

sursa: DALL·E 2 (openai.com)

Din nou, lăsând la o parte prejudecățile și stereotipurile, este destul de evident cât de mult seamănă aceste imagini cu cele pe care le-ați găsi pe un site web de fotografii de modă veche sau seturile gratuite de antrenament cu date despre imagini care sunt disponibile pe internet (deși nu trebuie utilizate pentru scopuri comerciale).

În seturile de date pe care le-am menționat anterior, imaginile pot avea o licență Creative Commons pe adnotările lor și o licență Flickr pe imaginile în sine, dar nu au, ceea ce este cunoscut în industria de imagini ca modele și eliberări de proprietate.

Practic, aceasta înseamnă că persoanele de pe imagini NU au aprobat să fie utilizate în niciun fel de scopuri comerciale, așa că utilizarea imaginilor în astfel de scopuri ar putea cauza probleme legale și ajungeți să primiți o scrisoare de încălcare a drepturilor de autor.

Nu sunteți asigurat în niciun fel, așa că aveți grijă

Deci, ce se întâmplă când combini aceste imagini pentru a se transforma în imagini noi? Trece problema legala? Evident nu. Poate fi mai greu de documentat, dar este încă o problemă.

Din toate aceste motive, sfatul nostru este să fim foarte atenți atunci când utilizați imagini generate de AI ca acestea în scopuri comerciale. Acest lucru înseamnă pentru buletinul informativ, blogul, site-ul web, campaniile de marketing, prezentarea și oriunde altundeva, unde comunicați despre afacerea dvs.

Nu sunteți protejat legal în niciun fel; nu ai o asigurare, ca pe JumpStory, iar dacă ai probleme, DALLE nu te va ajuta.

Folosiți această tehnologie nouă și distractivă pentru ceea ce este - distracție -, dar nu riscați, atunci când vorbim despre afacerea dvs.