Perché dovresti stare attento usando DALLE-2 e le immagini di metà viaggio per scopi commerciali
Pubblicato: 2022-07-29Quando la società Open AI ha lanciato la sua versione nuova ea pagamento dello strumento AI DALLE-2, è successo qualcosa anche con i termini di licenza. In questo breve post spieghiamo perché amiamo i nuovi progressi nella tecnologia di generazione da testo a immagine, ma perché ti incoraggiamo anche a fare attenzione, se prevedi di utilizzare una di queste immagini per scopi commerciali.
DALLE 2 è solo una delle tante nuove piattaforme che ti offrono l'accesso a contenuti generati dall'intelligenza artificiale e afferma che puoi utilizzarli per scopi commerciali. Altre piattaforme includono Midjourney, Jasper Art, Nightcafe, Starry AI e Craiyon. Ci concentreremo su Dalle 2 in questo post sul blog, ma sono quasi identificativi, quando si tratta di sfide e problemi legali.
La tecnologia utilizzata in DALLE 2 (scusate se diventa un po' geek )
Hai sentito parlare di DALLE 2 di Open-AI? Lo strumento AI che crea magicamente immagini dal testo. Se ce l'hai, allora devi leggere anche questo...
In superficie sembra piuttosto sorprendente. Chiedi a DALLE di generare una foto di un assistente di volo, ed ecco cosa ottieni:
fonte: DALL·E 2 (openai.com)
Alcuni hanno sostenuto che troppi dei risultati DALLE-2 sono stereotipi e prevenuti, ma non è questo il vero problema qui. Il vero problema è la legalità di queste immagini.
Alcune delle immagini create sono il più vicino possibile alle foto stock della vecchia scuola, e lo sono per un motivo. Anche se Open AI si rifiuta di rivelare tutti i set di dati che hanno utilizzato per addestrare la propria IA, è chiaro che queste immagini non sono un'IA artistica che immagina come sarebbe un assistente di volo. Sono vecchi database di immagini e foto d'archivio scadenti quasi replicate 1:1.
Se guardi più a fondo nella documentazione di DALLE-2, quello che trovi sono una serie di documenti di ricerca:
[2204.06125] Generazione gerarchica di immagini condizionali al testo con latenti CLIP (arxiv.org)
[2112.10741] GLIDE: Verso la generazione e la modifica di immagini fotorealistiche con modelli di diffusione guidati dal testo (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf
Secondo i documenti, l'unico set di dati pubblico (potrebbero essercene altri che l'azienda non vuole pubblicare in pubblico) che è stato utilizzato per addestrare DALLE 2 è il cosiddetto set di dati COCO.
Questo è un set di dati che è stato raccolto nell'ambito di un progetto sponsorizzato da Microsoft e altri. Mi dispiace essere un po' tecnico ora, ma il set di dati è composto da due cose:
1) Le annotazioni sulle immagini. Un'annotazione significa fondamentalmente una nota, un testo e/o una descrizione aggiunti a ciascuna immagine. Queste annotazioni sono state rilasciate sotto la cosiddetta Licenza Creative Commons Attribution 4.0.
2) Le immagini stesse. Queste immagini NON appartengono al progetto COCO. Sono stati acquistati da Flickr e devono pertanto rispettare i Termini di utilizzo di Flickr.
E come si legge sul sito web: "Gli utenti delle immagini si assumono la piena responsabilità per l'uso del set di dati, incluso ma non limitato all'uso di eventuali copie di immagini protette da copyright che possono creare dal set di dati".
Quindi cosa significa questo per te come utente normale di foto, video ecc. e per il tuo marketing e comunicazione quotidiana? Devi stare attento e pensarci due volte!
Da aperto e gratuito a chiuso e pagato
Le questioni legali sono potenzialmente enormi. Ora che DALLE-2 è passato da aperto e gratuito a chiuso e pagato, hanno anche cambiato i loro termini, in modo che ...
"Puoi utilizzare tutte le immagini che generi per tutti gli scopi commerciali."
Questa è ovviamente un'affermazione piuttosto audace, ma se riesci a convincere il pubblico che questa IA dovrebbe essere paragonata a un artista creativo piuttosto che a una persona che modifica Photoshop che si ispira più che alle foto stock esistenti, potrebbe funzionare, giusto?
Tuttavia, guardando l'output, quando si tratta di persone e immagini realistiche, questo non è un artista creativo al lavoro. Si tratta di repliche modificate di set di dati che non possono essere utilizzate per scopi commerciali come descritto sopra.
Cosa dicono gli esperti?
Quando è stato chiesto all'avvocato ed esperto di IP Bradley J. Hulbert la sua opinione, questo è ciò che ha detto a TechCrunch in un'intervista:
"L'intelligenza artificiale generatrice di immagini ridimensiona enormemente il problema della violazione del copyright, perché abbassa la barriera all'ingresso".
Sistemi come DALL-E 2 fonti / immagini raschiate da innumerevoli siti Web pubblici e non esiste un precedente legale diretto negli Stati Uniti che sostiene i dati pubblicamente disponibili come fair use. Quindi, le questioni legali si applicano sia alle immagini generate che al set di dati utilizzato per addestrarle.
"Ci sono grossi problemi con i diritti sulle immagini e le persone, i luoghi e gli oggetti all'interno delle immagini su cui vengono addestrati modelli come DALL-E 2".
Come altro esempio, ecco la nuova DALLE 'creazione' immagini di un avvocato:
fonte: DALL·E 2 (openai.com)
Ancora una volta, pregiudizi e stereotipi a parte, è abbastanza ovvio quanto queste immagini assomiglino a quelle che potresti trovare su un sito Web di foto stock vecchio stile o sui set di formazione di dati immagine disponibili su Internet (sebbene non da usare per motivi commerciali).
Nei set di dati che abbiamo menzionato prima, le immagini possono avere una licenza Creative Commons sulle loro annotazioni e una licenza Flickr sulle immagini stesse, ma non hanno ciò che è noto nell'industria delle immagini come liberatorie per modelli e proprietà.
Ciò significa sostanzialmente che le persone sulle immagini NON hanno approvato l'uso per alcun tipo di scopo commerciale, quindi l'utilizzo delle immagini per tali scopi potrebbe potenzialmente causare problemi legali e si finisce per ricevere una lettera di violazione del copyright.
Non sei assicurato in alcun modo, quindi fai attenzione
Quindi, cosa succede, quando combini queste immagini per trasformarle in nuove immagini? Il problema legale scompare? Ovviamente no. Potrebbe essere più difficile da documentare, ma è ancora un problema.
Per tutti questi motivi il nostro consiglio è di prestare molta attenzione quando si utilizzano immagini generate dall'IA come queste per scopi commerciali. Ciò significa per la tua newsletter, blog, sito Web, campagne di marketing, presentazioni e ovunque, dove comunichi sulla tua attività.
Non sei protetto legalmente in alcun modo; non hai un'assicurazione, come su JumpStory, e se ti trovi nei guai, DALLE non ti aiuterà.
Usa questa nuova e divertente tecnologia per quello che è - divertente -, ma non correre rischi, quando si tratta della tua attività di cui stiamo parlando.