Por qué debe tener cuidado al usar imágenes DALLE-2 y Midjourney con fines comerciales

Publicado: 2022-07-29

Cuando la empresa Open AI lanzó su nueva versión paga de la herramienta AI DALLE-2, algo también sucedió con sus términos de licencia. En esta breve publicación, explicamos por qué nos encantan los nuevos avances en la tecnología de generación de texto a imagen, pero también le recomendamos que tenga cuidado si planea utilizar alguna de estas imágenes con fines comerciales.

DALLE 2 es solo una de las muchas plataformas nuevas que le ofrecen acceso a contenido generado por IA y afirma que puede usarlo con fines comerciales. Otras plataformas incluyen Midjourney, Jasper Art, Nightcafe, Starry AI y Craiyon. Nos centraremos en Dalle 2 en esta publicación de blog, pero son casi idénticos cuando se trata de desafíos y problemas legales.

Tabla de contenido

La tecnología utilizada en DALLE 2 (perdón si esto se vuelve un poco geek) )

¿Has oído hablar de DALLE 2 de Open-AI? La herramienta de IA que mágicamente crea imágenes a partir de texto. Si es así, también debes leer esto...

En la superficie parece bastante sorprendente. Pídele a DALLE que genere una foto de un asistente de vuelo, y esto es lo que obtienes:

fuente: DALL·E 2 (openai.com)

Algunos han argumentado que muchos de los resultados de DALLE-2 son estereotipos y están sesgados, pero ese no es el verdadero problema aquí. El verdadero problema es la legalidad de estas imágenes.

Algunas de las imágenes creadas son lo más parecidas a las fotos de archivo de la vieja escuela, y lo son por una razón. Aunque Open AI se niega a revelar todos los conjuntos de datos que han estado usando para entrenar su IA, está claro que estas imágenes no son una IA artística que imagina cómo sería una azafata. Son bases de datos de imágenes antiguas y fotos de archivo deficientes casi replicadas 1:1.

Si profundiza en la documentación de DALLE-2, lo que encontrará son una serie de trabajos de investigación:
[2204.06125] Generación de imágenes condicionales de texto jerárquico con CLIP Latents (arxiv.org)
[2112.10741] GLIDE: Hacia la generación y edición de imágenes fotorrealistas con modelos de difusión guiados por texto (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf

Según los documentos, el único conjunto de datos público (puede haber más que la empresa no quiera publicar en público) que se ha utilizado para entrenar a DALLE 2 es el llamado conjunto de datos COCO.

Este es un conjunto de datos que se recopiló como parte de un proyecto patrocinado por Microsoft y otros. Lamento volverme un poco técnico ahora, pero el conjunto de datos consta de dos cosas:

1) Las anotaciones en las imágenes. Una anotación básicamente significa una nota, texto y/o descripción añadida a cada imagen. Estas anotaciones han sido publicadas bajo la llamada Licencia Creative Commons Attribution 4.0.

2) Las propias imágenes. Estas imágenes NO pertenecen al proyecto COCO. Se han obtenido de Flickr y, por lo tanto, deben cumplir con los Términos de uso de Flickr.

Y como dice en el sitio web: "Los usuarios de las imágenes aceptan toda la responsabilidad por el uso del conjunto de datos, incluido, entre otros, el uso de cualquier copia de las imágenes con derechos de autor que puedan crear a partir del conjunto de datos".

Entonces, ¿qué significa esto para usted como usuario normal de fotos, videos, etc. y para su marketing y comunicación diarios? ¡Tienes que tener cuidado y pensar dos veces!

De abierto y gratuito a cerrado y de pago

Los problemas legales son potencialmente masivos. Ahora que DALLE-2 ha pasado de ser abierto y gratuito a cerrado y de pago, también han cambiado sus términos, por lo que…

“Puedes usar todas las imágenes que generas para todos los fines comerciales”.

Por supuesto, esta es una declaración bastante audaz, pero si puede convencer al público de que esta IA debe compararse con un artista creativo en lugar de una persona que edita Photoshop y se inspira más en las fotos de archivo existentes, podría funcionar, ¿verdad?

Sin embargo, mirando el resultado, cuando se trata de personas e imágenes realistas, este no es un artista creativo en el trabajo. Se trata de réplicas editadas de conjuntos de datos que no se pueden utilizar con fines comerciales, como se describe anteriormente.

¿Qué dicen los expertos?

Cuando se le preguntó al abogado y experto en propiedad intelectual Bradley J. Hulbert sobre su opinión, esto es lo que dijo a TechCrunch en una entrevista:

“La IA generadora de imágenes escala enormemente el problema de la infracción de derechos de autor, porque reduce la barrera de entrada”.

Sistemas como fuentes DALL-E 2 / imágenes extraídas de innumerables sitios web públicos, y no existe un precedente legal directo en los EE. UU. que defienda los datos disponibles públicamente como uso justo. Por lo tanto, los problemas legales se aplican tanto a las imágenes generadas como al conjunto de datos utilizado para entrenarlas.

“Hay grandes problemas con los derechos de las imágenes y las personas, lugares y objetos dentro de las imágenes en las que se entrenan modelos como DALL-E 2”.

Como otro ejemplo, aquí está el nuevo DALLE 'creando' imágenes de un abogado:

fuente: DALL·E 2 (openai.com)

Una vez más, dejando de lado los sesgos y los estereotipos, es bastante obvio cuánto se parecen estas imágenes a las que encontraría en un sitio web antiguo de fotos de archivo o en los conjuntos gratuitos de entrenamiento de datos de imágenes que están disponibles en Internet (aunque no deben usarse para propósitos comerciales).

En los conjuntos de datos que mencionamos antes, las imágenes pueden tener una licencia de Creative Commons en sus anotaciones y una licencia de Flickr en las propias imágenes, pero no tienen lo que se conoce en la industria de las imágenes como autorizaciones de modelo y propiedad.

Básicamente, esto significa que las personas en las imágenes NO han aprobado su uso para ningún tipo de fines comerciales, por lo que el uso de las imágenes para tales fines podría causar problemas legales y terminaría recibiendo una carta de infracción de derechos de autor.

No está asegurado de ninguna manera, así que tenga cuidado.

Entonces, ¿qué sucede cuando combinas estas imágenes para convertirlas en nuevas imágenes? ¿Se va el problema legal? Obviamente no. Puede ser más difícil de documentar, pero sigue siendo un problema.

Por todas estas razones, nuestro consejo es tener mucho cuidado al usar imágenes generadas por IA como estas con fines comerciales. Esto significa para su boletín informativo, blog, sitio web, campañas de marketing, presentaciones y en cualquier otro lugar donde comunique su negocio.

No estás legalmente protegido de ninguna manera; no tienes un seguro, como lo tienes en JumpStory, y si te metes en problemas, DALLE no te va a ayudar.

Utilice esta nueva y divertida tecnología por lo que es - diversión -, pero no se arriesgue, cuando estamos hablando de su negocio.