Por que você deve ter cuidado ao usar imagens DALLE-2 e Midjourney para fins comerciais
Publicados: 2022-07-29Quando a empresa Open AI lançou sua versão nova e paga da ferramenta AI DALLE-2, algo também aconteceu com seus termos de licenciamento. Neste breve post, explicamos por que adoramos os novos avanços na tecnologia de geração de texto para imagem, mas também por que incentivamos você a ter cuidado se planeja usar qualquer uma dessas imagens para fins comerciais.
DALLE 2 é apenas uma das muitas novas plataformas que oferecem acesso a conteúdo gerado por IA e afirmam que você pode usá-lo para fins comerciais. Outras plataformas incluem Midjourney, Jasper Art, Nightcafe, Starry AI e Craiyon. Vamos nos concentrar em Dalle 2 neste post do blog, mas eles são quase idênticos, quando se trata de desafios e problemas legais.
A tecnologia usada em DALLE 2 (desculpe se isso se tornar um pouco nerd
)
Você já ouviu falar sobre DALLE 2 da Open-AI? A ferramenta de IA que cria magicamente imagens a partir de texto. Se você tem, então você precisa ler isso também…
Na superfície parece bastante surpreendente. Peça a DALLE para gerar uma foto de um comissário de bordo e aqui está o que você obtém:
fonte: DALL·E 2 (openai.com)
Alguns têm argumentado que muitos dos resultados do DALLE-2 são estereótipos e tendenciosos, mas esse não é o verdadeiro problema aqui. O verdadeiro problema é a legalidade dessas imagens.
Algumas das imagens criadas são o mais próximo possível das fotos antigas, e são assim por um motivo. Embora a Open AI se recuse a divulgar todos os conjuntos de dados que eles usaram para treinar sua IA, está claro que essas imagens não são uma IA artística imaginando como seria uma comissária de bordo. São bancos de dados de imagens antigos e fotos ruins quase replicadas 1:1.
Se você examinar mais profundamente a documentação do DALLE-2, o que encontrará são vários trabalhos de pesquisa:
[2204.06125] Geração de imagem condicional de texto hierárquica com CLIP Latents (arxiv.org)
[2112.10741] GLIDE: Rumo à geração e edição de imagens fotorrealistas com modelos de difusão guiados por texto (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf
De acordo com os jornais, o único conjunto de dados público (pode haver mais que a empresa não queira publicar em público) que foi usado para treinar DALLE 2 é o chamado conjunto de dados COCO.
Este é um conjunto de dados que foi coletado como parte de um projeto patrocinado pela Microsoft e outros. Desculpe ser um pouco técnico agora, mas o conjunto de dados consiste em duas coisas:
1) As anotações nas imagens. Uma anotação basicamente significa uma nota, texto e/ou descrição adicionada a cada imagem. Essas anotações foram lançadas sob a chamada Licença Creative Commons Atribuição 4.0.
2) As próprias imagens. Estas imagens NÃO pertencem ao projeto COCO. Eles foram obtidos do Flickr e, portanto, devem cumprir os Termos de Uso do Flickr.
E como diz no site: “Os usuários das imagens aceitam total responsabilidade pelo uso do conjunto de dados, incluindo, mas não se limitando ao uso de quaisquer cópias de imagens protegidas por direitos autorais que possam criar a partir do conjunto de dados”.
Então, o que isso significa para você como um usuário normal de fotos, vídeos etc. e para seu marketing e comunicação diários? Você precisa ter cuidado e pensar duas vezes!

De aberto e gratuito a fechado e pago
As questões legais são potencialmente enormes. Agora que o DALLE-2 mudou de aberto e gratuito para fechado e pago, eles também mudaram seus termos, para que…
“Você pode usar todas as imagens que gerar para todos os fins comerciais.”
É claro que esta é uma afirmação bastante ousada, mas se você puder convencer o público de que essa IA deve ser comparada a um artista criativo, em vez de uma pessoa de edição do Photoshop mais do que inspirada em fotos existentes, pode funcionar, certo?
No entanto, olhando para a saída, quando se trata de pessoas e imagens realistas, este não é um artista criativo em ação. Trata-se de replicações editadas de conjuntos de dados que não podem ser usados para fins comerciais, conforme descrito acima.
O que dizem os especialistas?
Quando o advogado e especialista em IP Bradley J. Hulbert foi questionado sobre sua opinião, eis o que ele disse ao TechCrunch em uma entrevista:
“A IA geradora de imagens escala muito o problema da violação de direitos autorais, porque reduz a barreira de entrada.”
Sistemas como fontes DALL-E 2 / imagens extraídas de inúmeros sites públicos, e não há precedente legal direto nos EUA que defenda dados publicamente disponíveis como uso justo. Portanto, as questões legais se aplicam às imagens geradas E ao conjunto de dados usado para treiná-las.
“Existem grandes problemas com os direitos das imagens e as pessoas, lugares e objetos dentro das imagens em que modelos como DALL-E 2 são treinados.”
Como outro exemplo, aqui está a nova DALLE 'criando' imagens de um advogado:
fonte: DALL·E 2 (openai.com)
Novamente, preconceitos e estereótipos à parte, é bastante óbvio o quanto essas imagens se assemelham às que você encontraria em um site de fotos antiquado ou aos conjuntos de treinamento de dados de imagem gratuitos que estão disponíveis na Internet (embora não sejam usados para objetivos comerciais).
Nos conjuntos de dados que mencionamos anteriormente, as imagens podem ter uma licença Creative Commons em suas anotações e uma licença Flickr nas próprias imagens, mas não possuem, o que é conhecido na indústria da imagem como autorização de modelo e propriedade.
Isso basicamente significa que as pessoas nas imagens NÃO aprovaram o uso para qualquer tipo de finalidade comercial, portanto, usar as imagens para tais fins poderia causar problemas legais e você acaba recebendo uma carta de violação de direitos autorais.
Você não está segurado de forma alguma, então tenha cuidado
Então, o que acontece, quando você combina essas imagens para se transformar em novas imagens? O problema jurídico desaparece? Obviamente não. Pode ser mais difícil documentar, mas ainda é um problema.
Por todas essas razões, nosso conselho é ter muito cuidado ao usar imagens geradas por IA como essas para fins comerciais. Isso significa para o seu boletim informativo, blog, site, campanhas de marketing, pitch decks e em qualquer outro lugar, onde você se comunica sobre seus negócios.
Você não está legalmente protegido de forma alguma; você não tem seguro, como no JumpStory, e se tiver problemas, DALLE não vai te ajudar.
Use esta nova e divertida tecnologia pelo que ela é - divertida -, mas não se arrisque, quando é do seu negócio que estamos falando.