لماذا يجب أن تكون حذرًا عند استخدام صور DALLE-2 و Midjourney للأغراض التجارية
نشرت: 2022-07-29عندما أطلقت شركة Open AI نسختها الجديدة والمدفوعة من أداة AI-tool DALLE-2 ، حدث شيء أيضًا مع شروط الترخيص الخاصة بها. في هذا المنشور القصير ، نشرح لماذا نحب التطورات الجديدة في تقنية إنشاء تحويل النص إلى صورة ، ولكن لماذا نشجعك أيضًا على توخي الحذر ، إذا كنت تخطط لاستخدام أي من هذه الصور لأغراض تجارية.
DALLE 2 هي مجرد واحدة من العديد من المنصات الجديدة التي تتيح لك الوصول إلى المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ، وتدعي أنه يمكنك استخدامه لأغراض تجارية. تشمل المنصات الأخرى Midjourney و Jasper Art و Nightcafe و Starry AI و Craiyon. سنركز على Dalle 2 في منشور المدونة هذا ، لكنهما متطابقان تقريبًا ، عندما يتعلق الأمر بالتحديات والمشكلات القانونية.
التكنولوجيا المستخدمة في DALLE 2 (آسف إذا أصبح هذا غريب الأطوار بعض الشيء )
هل سمعت عن DALLE 2 من Open-AI؟ أداة الذكاء الاصطناعي التي تنشئ الصور بطريقة سحرية من النص. إذا كان لديك ، فأنت بحاجة إلى قراءة هذا أيضًا ...
على السطح يبدو مذهلاً جدًا. اطلب من DALLE إنشاء صورة لمضيفة طيران ، وإليك ما تحصل عليه:
المصدر: DALL · E 2 (openai.com)
كان البعض يجادل بأن الكثير من نتائج DALLE-2 عبارة عن قوالب نمطية ومنحازة ، لكن هذه ليست المشكلة الحقيقية هنا. المشكلة الحقيقية هي شرعية هذه الصور.
بعض الصور التي تم إنشاؤها قريبة من صور مخزون المدرسة القديمة ، كما يمكنك الحصول عليها ، وهي كذلك لسبب ما. على الرغم من رفض Open AI الكشف عن جميع مجموعات البيانات التي استخدموها لتدريب الذكاء الاصطناعي الخاص بهم ، فمن الواضح أن هذه الصور ليست تقنية ذكاء اصطناعي فنية تتخيل الشكل الذي ستبدو عليه المضيفة. إنها قواعد بيانات قديمة للصور وصور مخزنة رديئة يتم تكرارها تقريبًا 1: 1.
إذا نظرت بشكل أعمق في توثيق DALLE-2 ، ستجد عددًا من الأوراق البحثية:
[2204.06125] إنشاء هرمي للنص الشرطي باستخدام CLIP Latents (arxiv.org)
[2112.10741] GLIDE: نحو إنشاء صور واقعية وتحريرها باستخدام نماذج الانتشار الموجهة بالنص (arxiv.org)
https://cdn.openai.com/papers/dall-e-2.pdf
وفقًا للأوراق ، فإن مجموعة البيانات العامة الوحيدة (قد يكون هناك المزيد الذي لا ترغب الشركة في نشره علنًا) التي تم استخدامها لتدريب DALLE 2 هي ما يسمى مجموعة بيانات COCO.
هذه مجموعة بيانات تم جمعها كجزء من مشروع برعاية Microsoft وغيرها. نأسف لأنك أصبحت تقنيًا بعض الشيء الآن ، لكن مجموعة البيانات تتكون من شيئين:
1) الشروح على الصور. يعني التعليق التوضيحي بشكل أساسي ملاحظة و / أو نص و / أو وصف مضاف إلى كل صورة. تم إصدار هذه التعليقات التوضيحية بموجب ما يسمى ترخيص Creative Commons Attribution 4.0.
2) الصور نفسها. هذه الصور لا تنتمي إلى مشروع COCO. لقد تم الحصول عليها من Flickr وبالتالي يجب أن تلتزم بشروط استخدام Flickr.
وكما هو موضح على موقع الويب: "يتحمل مستخدمو الصور المسؤولية الكاملة عن استخدام مجموعة البيانات ، بما في ذلك على سبيل المثال لا الحصر استخدام أي نسخ من الصور المحمية بحقوق الطبع والنشر التي قد ينشئونها من مجموعة البيانات."
إذن ماذا يعني هذا بالنسبة لك كمستخدم عادي للصور ومقاطع الفيديو وما إلى ذلك وللتسويق والتواصل اليومي؟ عليك أن تكون حذرا وتفكر مرتين!
من مفتوح ومجاني إلى مغلق ومدفوع
القضايا القانونية يحتمل أن تكون ضخمة. الآن بعد أن تغيرت DALLE-2 من كونها مفتوحة ومجانية إلى مغلقة ومدفوعة ، قاموا أيضًا بتغيير شروطهم ، بحيث ...
"يمكنك استخدام جميع الصور التي تنشئها لجميع الأغراض التجارية."
هذا بالطبع بيان جريء جدًا ، ولكن إذا تمكنت من إقناع الجمهور بأنه يجب مقارنة الذكاء الاصطناعي هذا بفنان مبدع بدلاً من أن يكون الشخص الذي يقوم بتحرير Photoshop مستوحى من الصور الموجودة حاليًا ، فقد ينجح ، أليس كذلك؟
ومع ذلك ، بالنظر إلى الإخراج ، عندما يتعلق الأمر بالناس والصور الواقعية ، فهذا ليس فنانًا مبدعًا في العمل. هذه نسخ معدلة لمجموعة البيانات التي لا يُسمح باستخدامها للأغراض التجارية كما هو موضح أعلاه.
ماذا يقول الخبراء؟
عندما سُئل المحامي وخبير الملكية الفكرية برادلي جيه هولبرت عن رأيه ، هذا ما قاله لموقع TechCrunch في مقابلة:
"يعمل الذكاء الاصطناعي المولِّد للصور على زيادة مشكلة انتهاك حقوق الطبع والنشر إلى حد كبير ، لأنه يقلل من حاجز الدخول."
أنظمة مثل مصادر DALL-E 2 / الصور المقتبسة من عدد لا يحصى من مواقع الويب العامة ، ولا توجد سابقة قانونية مباشرة في الولايات المتحدة تدعم البيانات المتاحة للجمهور كاستخدام عادل. لذلك ، تنطبق المشكلات القانونية على الصور التي تم إنشاؤها ومجموعة البيانات المستخدمة لتدريبهم.
"هناك مشكلات كبيرة تتعلق بحقوق الصور والأشخاص والأماكن والأشياء داخل الصور التي تم تدريب نماذج مثل DALL-E 2 عليها."
كمثال آخر ، ها هي DALLE الجديدة "إنشاء" صور محامٍ:
المصدر: DALL · E 2 (openai.com)
مرة أخرى ، بغض النظر عن التحيزات والصور النمطية ، من الواضح تمامًا مدى تشابه هذه الصور مع تلك التي قد تجدها على موقع ويب للصور الفوتوغرافية قديم الطراز أو مجموعات التدريب على بيانات الصور المجانية المتوفرة على الإنترنت (على الرغم من عدم استخدامها من أجل أغراض تجارية).
في مجموعات البيانات التي ذكرناها من قبل ، قد يكون للصور ترخيص Creative Commons على التعليقات التوضيحية الخاصة بها وترخيص Flickr للصور نفسها ، لكن لم يحصلوا على ما هو معروف في صناعة الصور كنموذج وإصدارات ملكية.
هذا يعني بشكل أساسي أن الأشخاص الموجودين في الصور لم يوافقوا على استخدامها لأي نوع من الأغراض التجارية ، لذا فإن استخدام الصور لمثل هذه الأغراض قد يتسبب في مشاكل قانونية وينتهي بك الأمر بتلقي خطاب انتهاك حقوق النشر.
أنت لست مؤمنًا بأي شكل من الأشكال ، لذا كن حذرًا
إذن ، ماذا يحدث عندما تجمع هذه الصور لتتحول إلى صور جديدة؟ هل تختفي المشكلة القانونية؟ من الواضح أنه لا. قد يكون التوثيق أصعب ، لكنه لا يزال يمثل مشكلة.
لكل هذه الأسباب ، نصيحتنا هي توخي الحذر الشديد عند استخدام مثل هذه الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي للأغراض التجارية. هذا يعني بالنسبة إلى الرسائل الإخبارية والمدونة والموقع الإلكتروني والحملات التسويقية ومنصات العرض التقديمي المخططة وفي أي مكان آخر ، حيث تتواصل بشأن عملك.
أنت لست محميًا قانونيًا بأي شكل من الأشكال ؛ ليس لديك تأمين ، كما هو الحال في JumpStory ، وإذا واجهتك مشكلة ، فلن تساعدك DALLE.
استخدم هذه التقنية الجديدة والممتعة لما هي عليه - ممتعة - ولكن لا تأخذ أي فرصة ، عندما نتحدث عن عملك.