Pourquoi vous devriez être prudent en utilisant les images DALLE-2 et Midjourney à des fins commerciales

Publié: 2022-07-29

Lorsque la société Open AI a lancé sa nouvelle version payante de l'outil d'IA DALLE-2, quelque chose s'est également produit avec leurs conditions de licence. Dans ce court article, nous expliquons pourquoi nous aimons les nouvelles avancées de la technologie de génération de texte en image, mais pourquoi nous vous encourageons également à faire attention si vous envisagez d'utiliser l'une de ces images à des fins commerciales.

DALLE 2 n'est qu'une des nombreuses nouvelles plateformes vous offrant un accès au contenu généré par l'IA et affirmant que vous pouvez l'utiliser à des fins commerciales. Les autres plates-formes incluent Midjourney, Jasper Art, Nightcafe, Starry AI et Craiyon. Nous nous concentrerons sur Dalle 2 dans ce billet de blog, mais ils sont presque identiques, en ce qui concerne les défis et problèmes juridiques.

Table des matières

La technologie utilisée dans DALLE 2 (désolé si ça devient un peu geek )

Avez-vous entendu parler de DALLE 2 d'Open-AI ? L'outil AI qui crée comme par magie des images à partir de texte. Si vous en avez, alors vous devez lire ceci aussi…

En surface, cela semble assez étonnant. Demandez à DALLE de générer une photo d'un agent de bord, et voici ce que vous obtenez :

source : DALL·E 2 (openai.com)

Certains ont fait valoir que trop de résultats DALLE-2 sont stéréotypés et biaisés, mais ce n'est pas le vrai problème ici. Le vrai problème est la légalité de ces images.

Certaines des images créées sont aussi proches que possible des photos de la vieille école, et elles le sont pour une raison. Même si Open AI refuse de divulguer tous les ensembles de données qu'ils ont utilisés pour former leur IA, il est clair que ces images ne sont pas une IA artistique imaginant à quoi ressemblerait un agent de bord. Ce sont d'anciennes bases de données d'images et de mauvaises photos de stock presque reproduites 1: 1.

Si vous regardez plus profondément dans la documentation de DALLE-2, vous trouverez un certain nombre de documents de recherche :
[2204.06125] Génération hiérarchique d'images textuelles conditionnelles avec CLIP Latents (arxiv.org)
[2112.10741] GLIDE : vers la génération et l'édition d'images photoréalistes avec des modèles de diffusion guidés par le texte (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf

Selon les articles, le seul ensemble de données public (il pourrait y en avoir plus que l'entreprise ne veut pas publier en public) qui a été utilisé pour former DALLE 2 est le soi-disant ensemble de données COCO.

Il s'agit d'un ensemble de données qui a été collecté dans le cadre d'un projet parrainé par Microsoft et d'autres. Désolé de devenir un peu technique maintenant, mais l'ensemble de données se compose de deux choses :

1) Les annotations sur les images. Une annotation signifie essentiellement une note, un texte et/ou une description ajoutés à chaque image. Ces annotations ont été publiées sous la licence Creative Commons Attribution 4.0.

2) Les images elles-mêmes. Ces images n'appartiennent PAS au projet COCO. Ils proviennent de Flickr et doivent donc respecter les Conditions d'utilisation de Flickr.

Et comme il est dit sur le site Web : "Les utilisateurs des images acceptent l'entière responsabilité de l'utilisation de l'ensemble de données, y compris, mais sans s'y limiter, l'utilisation de toute copie d'images protégées par le droit d'auteur qu'ils peuvent créer à partir de l'ensemble de données."

Alors qu'est-ce que cela signifie pour vous en tant qu'utilisateur normal de photos, vidéos, etc. et pour votre marketing et votre communication au quotidien ? Il faut être prudent et réfléchir à deux fois !

De ouvert et gratuit à fermé et payant

Les problèmes juridiques sont potentiellement énormes. Maintenant que DALLE-2 est passé d'ouvert et gratuit à fermé et payant, ils ont également changé leurs conditions, de sorte que …

"Vous pouvez utiliser toutes les images que vous générez à toutes fins commerciales."

C'est bien sûr une déclaration assez audacieuse, mais si vous pouvez convaincre le public que cette IA devrait être comparée à un artiste créatif plutôt qu'à une personne qui édite Photoshop et qui s'inspire plus que des photos existantes, cela pourrait fonctionner, n'est-ce pas ?

Cependant, en regardant la sortie, quand il s'agit de personnes et d'images réalistes, ce n'est pas un artiste créatif au travail. Il s'agit de réplications éditées d'ensembles de données qui ne sont pas autorisés à être utilisés à des fins commerciales comme décrit ci-dessus.

Que disent les experts ?

Lorsque l'avocat et expert en propriété intellectuelle Bradley J. Hulbert a été interrogé sur son opinion, voici ce qu'il a dit à TechCrunch dans une interview :

"L'IA génératrice d'images étend considérablement le problème de la violation du droit d'auteur, car elle abaisse la barrière à l'entrée."

Des systèmes tels que DALL-E 2 sources / images extraites d'innombrables sites Web publics, et il n'y a pas de précédent juridique direct aux États-Unis qui confirme que les données accessibles au public sont une utilisation équitable. Ainsi, les problèmes juridiques s'appliquent à la fois aux images générées ET à l'ensemble de données utilisé pour les former.

"Il y a de gros problèmes avec les droits sur l'imagerie et les personnes, les lieux et les objets dans l'imagerie sur lesquels des modèles comme DALL-E 2 sont formés."

Comme autre exemple, voici le nouveau DALLE 'créant' des images d'un avocat :

source : DALL·E 2 (openai.com)

Encore une fois, mis à part les préjugés et les stéréotypes, il est tout à fait évident à quel point ces images ressemblent à celles que vous trouveriez sur un site Web de photos à l'ancienne ou aux ensembles de formation gratuits sur les données d'images disponibles sur Internet (mais ne doivent pas être utilisés pour fins commerciales).

Dans les ensembles de données que nous avons mentionnés précédemment, les images peuvent avoir une licence Creative Commons sur leurs annotations et une licence Flickr sur les images elles-mêmes, mais elles n'ont pas ce que l'on appelle dans l'industrie de l'image les autorisations de modèle et de propriété.

Cela signifie essentiellement que les personnes sur les images n'ont PAS approuvé leur utilisation à des fins commerciales, donc l'utilisation des images à de telles fins pourrait potentiellement causer des problèmes juridiques et vous finirez par recevoir une lettre de violation du droit d'auteur.

Vous n'êtes en aucun cas assuré, alors faites attention

Alors, que se passe-t-il lorsque vous combinez ces images pour en faire de nouvelles images ? Le problème juridique disparaît-il? Évidemment pas. C'est peut-être plus difficile à documenter, mais c'est toujours un problème.

Pour toutes ces raisons, nous vous conseillons d'être très prudent lorsque vous utilisez des images générées par l'IA comme celles-ci à des fins commerciales. Cela signifie pour votre newsletter, blog, site web, campagnes marketing, pitch decks et partout ailleurs, où vous communiquez sur votre entreprise.

Vous n'êtes en aucun cas protégé légalement ; vous n'avez pas d'assurance, comme vous en avez sur JumpStory, et si vous avez des ennuis, DALLE ne vous aidera pas.

Utilisez cette nouvelle technologie amusante pour ce qu'elle est - amusante -, mais ne prenez aucun risque, quand c'est de votre entreprise dont il s'agit.