الذكاء الاصطناعي في صندوق أدوات المصمم: تشكيل المستقبل مع ChatGPT

نشرت: 2023-02-08

بينما ترفع GPT المعايير وتصبح النماذج اللغوية الكبيرة أكثر تعقيدًا ، ما هي الآفاق الجديدة التي ستظهر للتفكير التصميمي؟ وكيف سيعطلون الدور التقليدي لمصممي المنتجات؟

أثار إطلاق ChatGPT زوبعة من الآراء والمناقشات ، حيث انخرط جميع الأشخاص في تبادلات ساخنة حول ما يعنيه ذلك لنا جميعًا. الآن ، نحن أول من يعترف بأن التنبؤات والتنبؤات التخمينية يمكن أن تكون مهمة حمقاء ، ولكن هناك شيء واحد مؤكد - هذه النماذج تسبب بالفعل تحولًا زلزاليًا في كيفية تفكيرنا في منتجاتنا وبناءها.

إذا كنت تستمع إلى Inside Intercom في الأسبوع الماضي ، فأنت تعلم أننا قفزنا سريعًا إلى عربة GPT ، وصممنا ميزات جديدة مدعومة بالذكاء الاصطناعي وشحنناها إلى 160 عميلًا تجريبيًا (لا تتردد في التحقق من الجزء الأول والجزء الأول اثنان من المحادثة إذا لم تكن قد قمت بذلك بالفعل). اليوم ، بالنسبة إلى الإصدار الأخير من محادثات GPT الخاصة بنا ، انضم إلينا بعض الأشخاص الذين قاموا بالفعل بعمل تصميم تطبيقي باستخدام ChatGPT ونماذج اللغات الكبيرة لبناء منتجات حقيقية تحل مشكلات حقيقية للعملاء.

في هذه الحلقة ، ستسمع من حديثنا:

إيميت كونولي ، نائب الرئيس لتصميم المنتجات
مولي ماهار ، مصممة المنتج للموظفين في فريق التعلم الآلي
Gustavs Cirulis ، كبير مصممي المنتجات الرئيسيين

سيتحدثون عن نماذج اللغات الكبيرة (LLMs) مثل ChatGPT ، وكيف سيشكلون دور مصمم المنتج في السنوات القادمة. لا يمكننا معرفة ما سيأتي به المستقبل ، ولكن إذا سألتنا ، فإن أفضل ما يمكنك فعله هو الاعتماد عليه.

فيما يلي بعض النقاط الرئيسية:

GPT جيد حقًا في تلخيص المحتوى وفهم اللغة وتحرير النص. لكن المشكلة الرئيسية هي أن إجاباتها تبدو معقولة في بعض الأحيان ، لكنها غير صحيحة من الناحية الواقعية.
مع تطور التكنولوجيا ، ستتحول مؤسسات الدعم من رد الفعل إلى الاستباقية من خلال تدريب الذكاء الاصطناعي والتأكد من أن الدعم يتم بطريقة محادثة تبدو طبيعية للبشر.
قد تظهر أنماط تصميم جديدة لإدارة عدم اليقين والتوقعات ، مثل بناء درجات الثقة في الميزات.
بمرور الوقت ، ستتمكن الشركات من استخدام نماذج مفتوحة المصدر وبناء طبقات فوقها بمعرفة متخصصة باستخدام بيانات الملكية من صناعتها أو شركتها.
في المستقبل ، قد يتضمن التفاعل مع الذكاء الاصطناعي واجهات محادثة وواجهات رسومية لزيادة سير العمل وحتى واجهات عصبية.
سيكون دور المصمم هو إنشاء واجهة AI تعمل كزميل ذكي وغير مهدد يمكنه زيادة سير عملك وجعل يومك أسهل.

تأكد من عدم تفويت أي من النقاط البارزة باتباع Inside Intercom على Apple Podcasts أو Spotify أو YouTube أو الحصول على موجز RSS في المشغل الذي تختاره. ما يلي هو نسخة منقحة قليلاً من الحلقة.

اللقاءات الأولى

إيميت كونولي: مرحبًا بكم جميعًا. مرحبًا بك في بودكاست Inside Intercom. أنا متحمس جدًا اليوم لانضمام مولي وجوستافس من فريق تصميم منتجات الاتصال الداخلي. منذ إطلاق ChatGPT قبل بضعة أسابيع ، كان هناك الكثير من المناقشات الساخنة ، والكثير من التكهنات العشوائية الخاملة ، والكثير من المدافعين عن الكراسي حول ما يعنيه كل ذلك. أود أن أقول إن معظمها من أشخاص لم يعملوا فعليًا بشكل مباشر مع التكنولوجيا على الإطلاق ، ولهذا السبب أنا متحمس جدًا للتحدث مع مولي وجوستاف اليوم. لأن Molly و Gustavs هما من الأقلية الصغيرة جدًا في العالم بأسره الذين قاموا بالفعل بعمل تصميم منتج تطبيقي حقيقي باستخدام ChatGPT والتقنيات ذات الصلة. أعني ، استخدامه فعليًا للتكامل مع المنتجات وحل مشكلات المنتج الحقيقية للعملاء الذين لديهم منتجات حقيقية تعمل على نطاق واسع. لذا ، مولي وجوستافس ، مرحبًا بكم في العرض. ربما ترغب في تقديم أنفسكم بإيجاز شديد. مولي ، هل تريد الذهاب؟

مولي ماهر: بالتأكيد. أنا مولي ماهر. أنا مصمم موظفين هنا في Intercom. أنا جديد نوعا ما. أنا جزء من فريق التعلم الآلي ، مع فريق من المهندسين ، ونقوم بالكثير من النماذج الأولية.

غوستافس سيروليس: مرحبًا ، أنا جوستافس. أنا مصمم منتج رئيسي ، وقد مكثت هنا لفترة أطول قليلاً من مولي. لقد كنت في كل مكان نوعًا ما ، لكن في الوقت الحالي ، أعمل في فريق النمو.

"ذكرني بالاقتصاد السلوكي في الكلية وبتأثير Dunning-Kruger ، حيث تكون غير كفء ولكن لديك ثقة مفرطة"

Emmet: سنتحدث اليوم عن الذكاء الاصطناعي ونماذج اللغات الكبيرة مثل ChatGPT. على وجه التحديد ، حول ما تعنيه للتصميم والمصممين. سنتحدث قليلاً عن الفرص الجديدة المتاحة للمصممين ، وتحديدًا مع هذه التكنولوجيا الجديدة ، وما كان عليه الحال بالنسبة لك أو ما هو مختلف في العمل مع الذكاء الاصطناعي مقابل المنتجات التقليدية ، وبعض التحديات التي واجهتها مثلك بدأت في تصميم هذه الميزات التي تعمل بالذكاء الاصطناعي. قد ندخل في بعض التنبؤات غير الحكيمة في مرحلة ما. لكن لنبدأ بالأساسيات. مولي ، ما كان رد فعلك الأول عندما هبطت ChatGPT على الساحة وأحدثت نجاحًا كبيرًا قبل بضعة أسابيع فقط؟ لقد كنت تعمل مع أنظمة AI و ML لفترة طويلة قبل ذلك.

مولي: حسنًا ، أولاً ، تعرضت للقصف بعدد من لقطات الشاشة على Slack وبدأت أراها تأتي من أشخاص في جميع أنحاء الشركة وعلى Twitter وكل شيء. لقد جربته وقلت ، "هذا رائع جدًا. هذا أيضًا ذكي جدًا ". كانت نماذج اللغات الكبيرة (LLM) موجودة منذ فترة ، لكنهم الآن وضعوا واجهة مستخدم على واجهة برمجة التطبيقات الخاصة بهم. وهكذا ، يستطيع المزيد من الناس في كل مكان استخدامها دون الحاجة إلى أن يكونوا مطورين أو أي شيء ، وهو ما أعتقد أنه رائع جدًا ويظهر مدى حماسة الناس تجاههم. لقد بدأت اللعب بها ، وهي قوية حقًا.

يمكنك طرح الكثير من الأسئلة عليه ، يمكنك المتابعة. إنه شعور رائع حقًا. يبدو الأمر وكأنه محادثة إلى حد ما. ثم بدأنا ، كفريق واحد ، بالبحث فيه لمحاولة اختبار التحمل. وشعرت وكأنني بدأت أرى الضجيج. لقد ذكرني بالاقتصاد السلوكي في الكلية وبتأثير دانينغ كروجر ، حيث تكون غير كفء ولكن مفرط في الثقة. وشعرت بهذا في بعض الأحيان. هذا ChatGPT أفضل بكثير مما أنا عليه في الهراء. أنا مندهش من ذلك. وهكذا ، مررت بموجة من المشاعر حيال ذلك. أتساءل عما إذا كان من المفيد إعطاء نظرة عامة سريعة على ماجستير في القانون.

"لقد كانت LLM موجودة منذ فترة ، وهي تتحسن وأسرع وأسرع. إن الشيء المدهش في ChatGPT هو أنه بصفتي شخصًا يمكنني استخدامه "

إيميت: أعتقد ذلك. أعتقد ، بالنسبة للكثير من الناس ، هناك هذا الارتباط مع ChatGPT كما يتحدث الجميع عن الذكاء الاصطناعي. لذا ، هل تمانع في أن تشرح بعبارات الشخص العادي ما هو ChatGPT وكيف يرتبط ذلك بمصطلحات أخرى مثل نماذج اللغة الكبيرة التي ربما سمع عنها الناس؟

مولي: نعم ، سأبذل قصارى جهدي. لذا ، فإن النماذج اللغوية الكبيرة ، LLM ، باختصار ، هي نماذج مدربة على مجموعة ضخمة من النصوص العامة من كل مكان - الكتب ، الإنترنت ، المصادر متعددة الوسائط ، على ما أعتقد ، في بعض الأحيان. مليارات ومليارات ومليارات من البيانات داخل. وغالبًا ما يتم تدريبهم على ردود الفعل البشرية على طول الطريق. أعتقد أن هذا يؤدي إلى سبب إمكانية إجراء هذه المحادثة مع ChatGPT - يمكنك تقديم ملاحظات لها ، وسوف تستجيب بالفعل لذلك وتغير ردودها. لقد كانت LLM موجودة منذ فترة ، وهي تتحسن وأسرع وأسرع. الشيء المدهش في ChatGPT هو أنه ، كشخص ، يمكنني بالفعل استخدامه. وثانيًا ، إنه حقًا جيد حقًا. ChatGPT هي الواجهة الأمامية ، بشكل أساسي ، وأنا أقوم بتبسيط هذا قليلاً ، لكنها الواجهة الأمامية لنموذج لغة كبير API يحتوي على OpenAI في الخلفية. ولديهم عدد من هؤلاء.

هناك الكثير من الشركات الأخرى التي لديها أيضًا نماذج لغوية كبيرة. تعمل Google على LaMDA ، وهناك شركات أخرى. وهكذا ، قد نقول ChatGPT هنا اليوم ، لكننا نشير إلى هذه التقنية بشكل عام. نحن نعمل بالفعل مع واجهات برمجة التطبيقات خلفه ، وليس مع ChatGPT ، والذي يتوفر فقط من خلال واجهة المستخدم حاليًا.

"من قبل ، كان الأمر مجرد نوع من" مهلا ، أنشئ لي هذه القصيدة عن أي شيء ". الآن ، يمكنك إجراء محادثة ذهابًا وإيابًا. هذه هي الطريقة التي يتفاعل بها البشر مع بعضهم البعض "

إيميت: أجل. وأعتقد أن أحد الأشياء المثيرة للاهتمام حول ChatGPT هو أنه ، من بعض النواحي ، ليس جديدًا من الناحية الفنية. ChatGPT هو تطبيق تم إنشاؤه باستخدام GPT-3.5 تم إنشاؤه بواسطة شركة تسمى OpenAI. لكن GPT-3.5 كان موجودًا منذ فترة - عدة أشهر ، أليس كذلك ، مولي؟ لذلك ، أنا فضولي. غوستافس ، ماذا كان رد فعلك؟ لماذا تعتقد أن هناك رد فعل مختلف لما نراه مع ChatGPT مقابل التقنية الأساسية ، والتي كانت متاحة لبعض الوقت؟

غوستافس: أعتقد أن الاختلاف الكبير هو أن العرض التقديمي يشبه المحادثة حيث يمكنك طرح أسئلة متابعة والتعمق أكثر. من قبل ، كان نوعًا ما ، "مرحبًا ، أنشئ لي هذه القصيدة عن أي شيء." الآن ، يمكنك إجراء محادثة ذهابًا وإيابًا. هذه هي الطريقة التي يتفاعل بها البشر مع بعضهم البعض. لذلك ، فهي مألوفة أكثر من إعطائها دفعة لمرة واحدة. عندما كنت ألعب مع ChatGPT عندما ظهرت للتو ، شعرت بالسحر. كان من الصعب حقًا تصديق وجود هذا. وواصلت اللعب بها ، وتحدثت عن مواضيع مختلفة ، وشعرت وكأنني لدي معلم شخصي عند الطلب يعرف كل شيء عن كل شيء. تحدثت عن كل أنواع الأشياء حول التكنولوجيا والتاريخ وعلم النفس وحتى الكوميديا. اتضح أنه من الجيد حقًا ابتكار الكوميديا الاحتياطية إذا أعطيتها دفعة جيدة. كان من الممتع فعل ذلك أيضًا.

حالة هلوسة

Emmet: لقد أمضيتما عدة أسابيع في العمل مع هذا الآن. كان لدينا جميعًا رد الفعل المبدئي المثير للإعجاب ، ولكن بعد أن أمضينا بضعة أسابيع في محاولة تطبيق هذا على مشاكل العملاء الحقيقية ، وربما تصارع مع تطبيقه بشكل مباشر بطريقة ما ، فهل يصمد أمام الضجيج ، غوستافس؟

غوستافس: أجل. بمجرد ظهور ChatGPT ، تأثرنا حقًا وأدركنا أنه يتعين علينا أن نفهم بشكل أفضل ما يعنيه ذلك لأعمالنا. يبدو أنه يمكن أن يكون له تأثير مفيد حقًا على صناعة خدمة العملاء بأكملها ، لذلك قمنا بتشكيل مجموعة عمل صغيرة واستكشفنا ما هو جيد في ChatGPT ، وما هو سيئ ، وما قد يعنيه لأعمالنا. بعد خوض هذا التمرين ، تراجعت مخاوفي ومخاوفي والضجيج قليلاً. يبدو أن التكنولوجيا ليست موجودة بعد لأخذ وظائفنا وأتمتة كل شيء.

"النموذج يريد أن يرضيك ، لذلك يريد أن يعطيك إجابة تعتقد أنك تريدها"

تبين أنه جيد حقًا في بعض الأشياء ، لكن ليس في كل شيء. إنه جيد ، على سبيل المثال ، في أشياء مثل تلخيص المحتوى أو فهم اللغة والتحرير والكتابة الإبداعية. لكن بها عيب كبير في الهلوسة ، حيث إنها تختلق أشياء تبدو حقيقية للغاية ولكنها غير صحيحة في الواقع ، والتي من الواضح أنها مشكلة كبيرة لحل خدمة العملاء. أنت لا تريد أن تعطي إجابات تبدو معقولة ، ولكن إجابات غير صحيحة من الناحية الواقعية. ولكن هناك الكثير من الأشياء المثيرة للاهتمام التي يمكنك تطبيقها عليها. وأعتقد أن المهم هو أن هذه التكنولوجيا تتطور بسرعة كبيرة. وهي في الحقيقة مسألة وقت فقط قبل أن تتمكن من تقديم إجابات صحيحة بشكل واقعي. وبمجرد حدوث ذلك ، سيكون الأمر مدمرًا حقًا.

إيميت: إذن ، ما تقوله هو أنها ستعطي إجابة مهما حدث. وفي بعض الحالات ، ينتج عن هذا ما تسميه الهلوسة. مولي ، هذا يبدو وكأنه قيد كبير لأي شخص يحاول استخدام هذا بشكل حقيقي. ما هي الهلوسة ولماذا تحدث في المقام الأول؟

مولي: نعم ، إنها مشكلة كبيرة ، كما قال جوستافس. النموذج يريد أن يرضيك ، لذلك يريد أن يعطيك إجابة يعتقد أنك تريدها. في بعض الأحيان ، يكون لديه مصدر موثوق لهذه المعلومات ، وأحيانًا ، يكون مجرد اختلاق للأشياء. يبدو وكأنه طفل. "لماذا فعلت ذلك؟" "حسنًا ، اعتقدت أن هذا هو ما تريده." قد تكون الهلوسة ناتجة عن الكثير من المصادر المختلفة. إذا طرحت عليه سؤالاً حول الاتصال الداخلي ، فلن يعرف بالضرورة أي شيء جديد. وهكذا ، قد يتطلب الأمر أجزاءً مما يعرفه من معرفة دقيقة وعامة من مكان آخر ، واستيفاء ذلك ، وبطريقة ما ، حاول استخدام الفطرة السليمة ، والتي ، بالطبع ، ليست موجودة. ليس لديها بالفعل قدرات منطقية. إنه يستخدم احتمالات مثل ، "حسنًا ، ربما يعمل هذا بهذه الطريقة ، لذا يمكنني تكوين إجابة حول شيء ما حول واجهة برمجة تطبيقات Intercom ،" أو شيء من هذا القبيل. وكما قال جوستافس ، هذا أمر معقول للغاية. يبدو واثقا جدا.

وكما ذكرت ، تركز شركات مختلفة على أشياء مختلفة. هناك شركات تركز أكثر قليلاً على كيفية تقليل الهلوسة. في حين أن ChatGPT ، على ما أعتقد ، غالبًا ما يركز كثيرًا على حواجز الحماية والأخلاق والوضوح بشأن ما يرفض الإجابة عليه.

Emmet: هل تعتقد أننا سنرى انتشارًا للكثير والكثير من النماذج المختلفة ويمكنك اختيار النموذج الذي يناسب نوع المقايضة بين الصواب التام والهلوسة التي تريدها ، أم أن هذه مشكلة قد فقط تختفي عندما تصبح العارضات أكثر نضجًا؟

"أوضح ChatGPT شيئًا مثيرًا للاهتمام ، وهو أن واجهة المستخدم وتجربة المستخدم لكل هذا مهمان جدًا"

مولي: لست متأكدًا من أنه سيختفي. لكن نعم ، هناك الكثير من النماذج بالفعل. هناك نماذج مفتوحة المصدر وهناك إمكانية للقيام بما نسميه الضبط الدقيق أعلى النموذج. GPT تعني المحولات التوليدية المدربة مسبقًا ، لذلك فهي تولد الأشياء. تم تدريبه مسبقًا على مجموعة كبيرة ومحولات. ستركز الشركات المختلفة على أشياء مختلفة. هناك نماذج مفتوحة المصدر ، والاتصال الداخلي ، كمستخدم محتمل لهذه النماذج ، قد يكون قادرًا على ضبطها للحصول على معرفة أكثر تخصصًا بصناعتنا أو شركتنا. ستتحسن التقنية أيضًا في استخدام بيانات أقل واحتياجها للحصول على نموذج رائع. وهكذا ، ستصبح النماذج أصغر وأصغر وأصغر. ومن المحتمل ، في هذه المرحلة ، قد يكون من المعقول أكثر بكثير بالنسبة لشركة أصغر أن تنشئ نموذجًا على بياناتها وأن تكون متخصصة تمامًا ، وذات معرفة جيدة ، وموثوقة للغاية.

Emmet: دعنا نغير التروس ونتحدث بشكل أكثر تحديدًا عن التصميم. من الواضح أن GPT و AI ، بشكل عام ، كانت في الأساس قصة تقنية ، لكنني أعتقد أن ChatGPT أوضحت شيئًا مثيرًا للاهتمام ، وهو أن واجهة المستخدم و UX لكل هذا مهمان للغاية. يبدو أن هناك تحولًا نحو واجهات مستخدم للمحادثة ، على سبيل المثال ، من المحتمل. هل تعتقد أن هذا صحيح؟ ما هو دور التصميم في تشكيل ما نفعله بهذه التقنية من هنا يا مولي؟

مولي: أعني ، الاتصال الداخلي في موقع جيد جدًا. يدور عملنا حول المحادثة وخدمة العملاء ، والناس متحمسون حقًا لإجراء محادثات مع هذه التقنية. لكن ما وجدناه مؤخرًا هو أنه ، على الأقل في الوقت الحالي ، هناك قدر كبير من القوة المتاحة في التكنولوجيا التي في الواقع ليست محادثة مباشرة ، ولكنها تتعلق بالمحادثة واللغة.

كما ذكرنا ، إنه أمر رائع في التلخيص ، وهناك الكثير من مهام سير العمل حيث يمكن للتلخيص أن يساعد حقًا وكلاء خدمة العملاء. لقد أطلقنا مؤخرًا إصدارًا تجريبيًا لبعض العملاء ، والتلخيص هو أحد الأشياء التي يجدها الأشخاص قيّمة حقًا حقًا. لقد أضفنا أيضًا بعض أدوات النص التوليفي للسماح للممثلين بإجراء تعديلات على رسائلهم إذا كانوا يريدون إعادة صياغة الأشياء ، أو جعلها أكثر ودية ، أو جعلها أكثر رسمية ، أو الحصول على مساعدة في توضيح الأشياء. هذا جزء من المحادثة ، لكنه لا يجري محادثة مباشرة مع ChatGPT. نجد أيضًا أنه مفيد للمساعدة في إنشاء أشياء مثل مقالات مركز المساعدة ، والتي كانت أيضًا جزءًا من هذا الإصدار التجريبي. يوجد الكثير من قوة هذا في بعض التطبيقات الأكثر خفية والتي ليست واضحة جدًا للأشخاص العاديين ولكنها تستغرق وقتًا طويلاً للممثلين. ويمكننا تقديم الكثير من القيمة مع ذلك.

"أنت تبحث عن هذا التقاطع بين الأشياء التي تجيدها التكنولوجيا والأشياء التي تكون فيها مخاطر منخفضة نسبيًا. وسنرى الكثير من هؤلاء في الأشهر القادمة "

غوستافس: أجل. هناك العديد من الطرق التي يمكنك من خلالها استخدام هذه التكنولوجيا ، ومن خلال ذلك ، تجنب بعض المشاكل التي رأيناها ، خاصةً مع الهلوسة ، حيث تصنع أشياء غير صحيحة. لكنها جيدة حقًا في أشياء أخرى. إنها جيدة في إعادة صياغة المحتوى الحالي ، ومن المنطقي أن تقود بذلك لأنها يمكن أن تقدم قيمة واضحة. سيكون الهدف النهائي هو أن تكون آليًا بالكامل وأن تقدم إجابات بالفعل. كل ما في الأمر أن التكنولوجيا ليست جيدة بما يكفي لذلك حتى الآن. لكن أعتقد أننا سنصل إلى هناك.

Emmet: وأظن أن هذه هي الطريقة التي سنرى بها الأشياء طوال عام 2023 لأنني أتخيل أننا سنبدأ في رؤية هذا يتسلل إلى العديد من المنتجات المختلفة ، ربما بطرق بسيطة نسبيًا ومضمونة للبدء بها ثم دفع القارب للخارج بشكل متزايد من حيث تعقيد ما يمكن أن تفعله. أعتقد أننا جميعًا اقتربنا من هذه الفرصة بمزيج من الإثارة وربما القليل من الخوف الصحي أيضًا. مولي ، لقد ذكرت أن لدينا هذه الميزات مدعومة بواسطة ChatGPT في الإصدار التجريبي في الوقت الحالي. وكانت ردود الفعل مشجعة وإيجابية للغاية. أولى العلامات التي نراها هي أن عملاء حقيقيين يحصلون على فائدة حقيقية من ميزات مثل تلخيص محادثة قبل تسليمها إلى شخص آخر. أنت تبحث عن هذا التقاطع بين الأشياء التي تجيدها التكنولوجيا والأشياء التي تكون فيها مخاطر منخفضة نسبيًا. وسنرى الكثير من هؤلاء في الأشهر القادمة. لذلك ، سيكون هذا مثيرًا.

AI للمحادثة

Emmet: Gustavs ، لقد كنت تفكر في هذا أكثر على المدى الطويل. هل يمكنك التحدث عن ذلك قليلا؟ لقد ذكرت الاتصال الداخلي - أحد الأسباب التي نتحدث عنها هنا هو أننا على الأرجح في وضع جيد جدًا ، نظرًا لطبيعة منتجاتنا ، وهي خدمة عملاء محادثة ، لتحقيق أقصى استفادة من هذا. ما رأيك عندما تفكر في فرص المنتج والتصميم طويلة الأجل؟

غوستافس: في الأيام الأولى لإطلاق ChatGPT ، قمنا بعمل ورشة العمل هذه لمحاولة التفكير في المستقبل ، وتحديدًا كيف سيبدو العالم إذا كان لدينا نموذج لا يعاني من مشكلة الهلوسة هذه وتمكن من تقديمه إجابات جيدة أو قل "لا أعرف". لقد كان الأمر واعدًا حقًا ، وقد زاد حقًا من ثقتنا بالعديد من الأشياء التي نؤمن بها بالفعل ولكننا نتسارع. نعتقد أنه سيتم حل غالبية استفسارات الدعم تلقائيًا تمامًا دون التحدث إلى البشر. إنه يتزايد بالفعل اليوم مع المزيد من "إذا كان هذا ، إذن" هذا النوع من البناة ، مع الروبوتات وروبوت الدقة الخاص بنا ، والذي يحتوي على بعض إمكانات التعلم الآلي ولكن ليس بنفس القدر مثل ChatGPT.

"سيحدث معظم الدعم بطريقة طبيعية جدًا للبشر ، وهي من خلال المحادثة"

نحن بالفعل على هذا الطريق ، لكن سيتسارع. ونتيجة لذلك ، ستبدأ مؤسسات الدعم في التحول من كونها تفاعلية وبشكل أساسي في البريد الوارد إلى كونها استباقية - إعداد وتدريب الذكاء الاصطناعي ؛ كتابة محتوى يمكن للذكاء الاصطناعي استخدامه لحل المحادثات.

أعتقد أن غالبية الدعم سيحدث بطريقة طبيعية للغاية للبشر ، وهي من خلال المحادثة. تخيل لو كان لديك شخص يمكنك التحدث إليه دائمًا وله إجابة مخصصة لك فقط. هذه هي الطريقة الأكثر طبيعية للتفاعل بين البشر. تجربة البحث والتصفح هذه التي نمتلكها اليوم ، حيث تبحث عن شيء ما على Google وتقوم بمسحها ضوئيًا لمحاولة العثور بسرعة على إجابات في مكان ما في المحتوى ، ليست أمرًا طبيعيًا بالنسبة للبشر. لا تزال هناك بعض الإصدارات من ذلك مع اقتراحات للمحتوى الذي قد يكون مناسبًا لك قبل بدء المحادثة. ولكن عندما تتفاعل معها ، فقد تظل تحادثية.

نعتقد أننا سنحتاج أيضًا إلى بناء جسر للوصول إلى هناك لأسباب متعددة. أعتقد أننا سنبدأ برؤية زيادة مندوب الدعم بأشياء مثل التلخيص أو إعادة الصياغة. لاحقًا ، سوف ندخل في اقتراحات للردود التي يمكن لممثلي الدعم تعديلها وتحسينها ، وفي وقت لاحق ، سوف ندخل في التشغيل الآلي الكامل. سيستغرق الأمر بعض الوقت ، بالنسبة للتكنولوجيا والجانب الإنساني أيضًا ، حتى تعتاد على استخدام المزيد والمزيد من الأتمتة.

Emmet: أنت تصف شيئًا ما حيث ، عبر مساحة واسعة جدًا من المنتج ، يوجد الكثير من الأماكن المختلفة حيث يمكن لهذا أن يغير طريقة عملنا ، سواء ما نسميه تجربة زميل الفريق وتجربة المستخدم النهائي ، في الاثنين جوانب المحادثة. لكنك تصف أيضًا هذه الفكرة الضبابية عن كيفية وصولنا إلى هذا المستقبل الغامض المتمثل في "نعتقد أن التكنولوجيا ستصل إلى هناك." يبدو لي أنه طريقة مختلفة تمامًا في التفكير حول الاقتراب من التصميم اليوم وفرقًا عميقًا تقريبًا في طريقة تفكيرنا في التفاعل مع أجهزة الكمبيوتر ، والانتقال من شيء حتمي للغاية ، صعب الحواف - من الصواب والخطأ والآحاد والأصفار - إلى شيء ما بطريقة ضبابية.

أنماط تصميم جديدة

Emmet: يبحث المصممون الآن في العمل مع هذه المواد التي تبدو وكأنها غير معروفة وبلاستيكية وأقل صلابة من تطبيقات CRUD ، "الإنشاء والكتابة والتحديث والحذف" التي اعتدنا عليها. ماذا وجدت؟ هل هناك اختلاف جوهري في الطريقة التي يحتاج بها المصممون للتعامل مع عملهم؟ هل وجدت بعض الأشياء صعبة أو صعبة؟ هل سيتعين على المصممين تعلم مهارات جديدة؟ ما حجم هذا التغيير بالنسبة لعملية التصميم ، حقيقة أن المادة التي نصمم بها تحتوي تقريبًا على عنصر عدم المعرفة هذا؟

"بمرور الوقت ، سنرى المزيد والمزيد من أنماط التصميم الجديدة التي تظهر لكيفية إدارة حالة عدم اليقين هذه والتوقعات من جميع الجوانب"

مولي: أعتقد أنه لا يزال هناك الكثير حول عملنا الذي سيبقى كما هو. نحن نجد مشاكل ، نحفر حول سير عمل الناس ، ونجد الأنماط. شيء واحد كبير هو الحاجة إلى التصميم لمزيد من حالات الفشل لأنه لا توجد بالضرورة حواجز حماية. عندما تجري محادثة ، يمكن أن تخرج عن المسار بعدة طرق مختلفة. وهو نفس الشيء مع نظام مثل هذا. البشر ، كنوع ، ليسوا جيدين في الاحتمالات. عندما ننظر إلى تقرير الطقس وهناك فرصة بنسبة 40٪ لتساقط الأمطار ، فليس لدينا إحساس كبير بما يعنيه ذلك.

إيميت: نعم ، ستصاب بخيبة أمل إذا لم تمطر لأنه قيل لك إنه سيكون هناك مطر.

مولي: أجل. أنا في هولندا - عندما أرى أي فرصة لهطول الأمطار ، فأنا أقول ، "ستمطر. إنها مجرد مسألة إلى متى ". هذا ما تعنيه النسب المئوية بالنسبة لي. لكننا لسنا رائعين في تفسيرها. أعتقد أن هذا سيكون شيئًا بالتأكيد عندما ننظر إلى مدى ثقة هذه التنبؤات لأنها تنبؤات بالكلمات التي يجب أن تأتي بعد ذلك. وسوف نتطلع إلى تحسين ذلك. هناك الكثير من التعامل مع السرعة التي تتحرك بها هذه التقنية وتغيرها ، ولا أعتقد أن هذا سيتغير. هناك الكثير من النماذج الأولية والتفاعل والتفكير في زمن الوصول. يمكن أن يكون وقت الاستجابة في الوقت الحالي طويلاً جدًا - تصميم لذلك. وهناك الكثير من النتائج غير المتوقعة. هذه بعض الأشياء التي كنت ألاحظها.

غوستافس: أعتقد أنه بمرور الوقت ، سنشهد ظهور المزيد والمزيد من أنماط التصميم الجديدة لكيفية إدارة حالة عدم اليقين هذه والتوقعات من جميع الجوانب. في الوقت الحالي ، كل شخص يقوم بالتجربة ويرى ما ينجح. نشهد بالفعل ظهور بعض الأنماط مع مطالبات صغيرة محددة مسبقًا حول كيفية تغيير النص مثل "توسيع هذا" ، "تلخيص هذا" ، "اجعله أكثر ودية". إنه نمط جديد نسبيًا بدأ في الظهور ، وأعتقد أننا سنرى المزيد والمزيد من تلك الأنواع من الأنماط. حتى هذا التفاعل حيث ، إذا طلبت من ChatGPT إنشاء محتوى ، فإن هذا المؤشر يتحرك ببطء. هذا نمط تصميم مثير للاهتمام أيضًا. إنه مطلوب تقنيًا ، لكنه يمكن أن يعمل بشكل جيد حقًا لتحديد التوقعات ، "مرحبًا ، هذا هو الذكاء الاصطناعي الذي ينشئ محتوى سريعًا."

"في هذه الأنظمة الجديدة التي قد تكون مؤتمتة للغاية ، هل نفكر في إضافة بعض الاحتكاك مرة أخرى حتى نحتفظ بالمهارات التي نشعر بأنها ذات قيمة والتي نريد أن نمتلكها؟"

Emmet: إذن ، أنت تقول أن تأثير الكتابة على شريط الفيديو كلمة بكلمة ، والذي هو ، لكي نكون واضحين ، وظيفة لكيفية صنع التكنولوجيا كلمة بكلمة ، يمكن أن يصبح مرادفًا وبطاقة اتصال مرئية . ربما سيحدث ذلك ، وربما لا ، لكن نوع الشيء الذي يميل إلى الظهور عندما نرى هذه التحولات والتقنيات الجديدة الناشئة قد يكون مثيرًا للاهتمام للتعمق في فكرة ظهور أنماط تصميم جديدة لأننا نرى ذلك عندما تأتي التقنيات الجديدة على امتداد. مولي ، هل هناك آخرون واجهتهم ، إما عند مستوى تصميم تفاعلي منخفض جدًا أو على مستوى عالٍ من كيفية دمج هذا في المنتجات؟

مولي: هناك بعض الأشياء الأخرى التي أعتقد أنها ستبدأ في الظهور أكثر. على سبيل المثال ، عندما نحاول تطوير ميزة ما ، يقوم المهندسون بإجراء اختبار رجعي. إنهم يستخدمون البيانات السابقة ويقومون بالتنبؤات حول ذلك ثم يقارنونها بما قاله أحد أعضاء الفريق بالفعل ، على سبيل المثال. بالنسبة لأشياء من هذا القبيل ، قد نحتاج إلى بدء التشغيل ليس على المستخدم النهائي ولكن من جانب زميل الفريق أو المسؤول ، حيث قد يرغب الأشخاص الذين يديرون مؤسسة CS في الحصول على ما أسميه إطلاقًا مظلمًا - ليس لديهم أشياء مباشرة ولكنهم قادرًا على مشاهدتها والحصول على فكرة ، "حسنًا ، أنا الآن أثق في استمرار ذلك." مراحل مختلفة من عمليات الإطلاق المظلمة ومسودة الاقتراحات والمراحل المختلفة لإطلاق بعض هذه الأدوات. أعتقد أن هذا سيكون أكثر بروزًا.

لا أعرف الاتجاه الذي ستسلكه ، لكنني أفكر في النقاط التي قد نضطر فيها إلى إضافة الاحتكاك مرة أخرى إلى النظام حتى لا نشعر بالرضا عن النفس. لا يزال الطيارون يقومون بأجزاء معينة من الرحلة ، على الرغم من أن نظام الطيار الآلي يقوم بمعظمها ، لأنهم بحاجة إلى عدم نسيان كيفية الطيران. لذا ، فإنهم يقومون بعمليات الإنزال أو أشياء أخرى. في هذه الأنظمة الجديدة التي قد تكون مؤتمتة للغاية ، هل نفكر في إضافة بعض الاحتكاك مرة أخرى حتى نحتفظ بالمهارات التي نشعر بأنها ذات قيمة والتي نريد أن نمتلكها؟

Emmet: ومن الواضح أن كل شيء تقريبًا له درجة ثقة ضمنية للميزة المضمنة فيه والتي يتعين عليك تصميمها. هل هذا شيء نعرضه للممثلين والمسؤولين أو لعملائهم؟ هناك حد أعلى بالنسبة لنا لعرض الأشياء لعملائهم أو حتى عند مستوى أدنى من التفاصيل. خذ القدرة على تلخيص محادثة طويلة. هل تنشر هذا التلخيص مباشرة في سلسلة المحادثة بنقرة زر واحدة ، أم أنك تمنح شخصًا ما الفرصة لمراجعته والموافقة عليه؟ دعها تمر مباشرة مقابل إضافة بوابة موافقة؟ أعتقد أننا سنشهد على الأرجح ظهور الكثير من تدفقات العمل ، على الأقل في البداية ، وبعد ذلك ، هل تبدأ في التراجع لأن التكنولوجيا تبني ثقة أكبر وأكبر؟

مولي: أجل ، بالضبط.

غوستافس: حتى مجرد القدرة على إخبارك بمدى ثقته. إذا كان بإمكان الذكاء الاصطناعي أن يخبرك ، "مرحبًا ، هذه هي إجابتي ، وهي صحيحة بنسبة 40٪" ، يمكنك تقديمها للإنسان للموافقة عليها قبل إرسالها. إذا كان واثقًا بنسبة 90٪ ، يمكنك المضي قدمًا وإرساله على الفور والحصول على زر "مرحبًا ، هذا غير صحيح" من جانب المستخدم النهائي. يعتمد الأمر حقًا على كيفية تطور التكنولوجيا. يجب أن يتطور التصميم جنبًا إلى جنب.

إيميت: أجل. اللهم امنحني ثقة نموذج لغوي كبير لأنه سيقول بثقة تامة الباطل التام والحقيقة الكاملة دون تمييز بينهما. وهذا هو شيء الثقة. في الوقت الحالي ، لا يوجد شيء يقول ، "أنا واثق بنسبة 100٪ في هذا البيان." في ChatGPT ، على الأقل. في بعض نماذج اللغات الأخرى ، أعتقد أننا بدأنا في رؤية المصادر المشار إليها ، والتي تبدو خطوة إيجابية.

إضافة طبقات في الأعلى

إيميت: يبدو أن هناك الكثير من الأشياء غير المعروفة ، والكثير من التفاصيل الدقيقة ، وقرارات التصميم العميقة مثل هذه للمشاركة فيها. دعنا نفحص ما تعنيه هذه الاتجاهات الكبرى للتصميم والمنتج. لقد شهد الناس أو كان جزءًا من وصول تقنيات كبيرة وجديدة. أفكر في أشياء مثل السحابة أو التحول بشكل كبير إلى الويب والجوال باعتبارها تقنيات تمكين كبيرة أدت إلى هذا العالم الجديد تمامًا من أنماط التصميم والمنتجات التي لم تكن متاحة من قبل. باستخدام السحابة ، رأينا النماذج والخلاصات والإعجابات وكل التحولات المرئية التي مرت بها الويب.

يمكنك قول الكثير من الشيء نفسه للجوال - كل شيء بدءًا من الخلاصات وقوائم الهامبرغر إلى السحب للتحديث والتمرير للحذف الذي نعتبره الآن جزءًا من مجموعة أدوات المصمم. ربما اقتربنا بشكل خطير من وقت التنبؤ ، ولكن ما هي تجربتك المبكرة في التعامل مع هذا؟ هل يخبرك بأي شيء عن أنواع المنتجات التي ستفوز بها أو تخسرها وما الأشياء الجديدة التي قد نشهدها والتي لم تكن ممكنة من قبل؟

"أعتقد أن الشركات التي ستفوز هي تلك التي سيكون لديها نوع من البيانات الخاصة وتأثير دولاب الموازنة الذي يجمع ويحسن باستمرار تلك البيانات"

غوستافس: أعتقد أنه بمرور الوقت ، ستستخدم معظم الشركات هذه النماذج اللغوية الكبيرة المتاحة للجمهور بدلاً من إنشاء نماذجها الخاصة. ولكن للتمييز عن بعضهم البعض ، قد يقومون ببناء طبقات فوقهم بمعرفة متخصصة. على سبيل المثال ، قد يكون لديك بيانات خاصة بالعمل - بالنسبة لأداة الدعم ، يمكن أن تكون إجابات لأسئلة محددة حول منتجك ومندوبي الدعم الذين يقدمون إجابات محددة بدلاً من المعرفة العامة. يمكن أن يكون حقًا معرفة عميقة بمجال معين ، مثل القانون.

أعتقد أن الشركات التي ستفوز هي تلك التي سيكون لديها نوع من البيانات الخاصة وتأثير دولاب الموازنة الذي يجمع ويحسن باستمرار تلك البيانات. الشيء الآخر الذي أعتقد أنه سيكون مثيرًا للاهتمام هو رؤية ما يفعله اللاعبون الكبار مثل Google و Apple و Microsoft بهذه التكنولوجيا وكيف يقومون بدمجها في مستوى نظام التشغيل. يمكن أن يكون لذلك تأثير كبير على نوع المنافذ المتاحة للشركات الأخرى.

"تخسر OpenAI الملايين يوميًا لتشغيل ChatGPT ، وربما يستحق ذلك من وجهة نظر العلاقات العامة أو أي بيانات بحثية يحصلون عليها ، ولكن هذا يعني أيضًا أنها لن تكون مجانية وممتعة"

إيميت: لقد بدأت بالقول إن معظم الناس سيقومون بدمج هذه النماذج اللغوية الكبيرة بطريقة معينة. أعتقد أن الشركات التي لا تنجح في فعل ما كنت تقوله ، وتجد في الواقع نوعًا من الخندق الدفاعي ، ستجد نفسها في الأساس غلافًا رقيقًا فوق GPT لا يفعل الكثير حقًا. لذا ، أنا أتفق معك تمامًا هناك. إذا كنت تفكر في شيء مثل متجر التطبيقات أو متاجر تطبيقات الأجهزة المحمولة ، فقد كان هناك الكثير من الألعاب والمصابيح اليدوية وأشياء من هذا القبيل في الأيام الأولى. وبعد ذلك ، تدريجيًا ، يتحول إلى أشياء تمكينية كبيرة مثل Uber ، والتي لا يمكن أن توجد إذا لم يكن لدينا هذا النموذج ، و Instagram ورسم الخرائط وما إلى ذلك. مولي ، أي شيء تود إضافته بناءً على تجربتك؟

مولي: لست متأكدًا تمامًا من أن الجميع سيستخدمون LLMs العامة. لدي خوف ضئيل من أن تكون باهظة الثمن بالنسبة للعديد من الشركات لجعل نموذج أعمالها يعمل أو أن بعض الشركات الكبيرة قد تبقيها خاصة. لذلك ، لست متأكدًا مما إذا كان الجميع سيستخدمون عامة أو ما إذا كان الأشخاص سيتحركون أكثر نحو المصدر المفتوح ويضعون طبقتهم الدقيقة في المقدمة. أوافق على أوضاع البيانات. على سبيل المثال ، في Intercom ، لدينا الكثير من بيانات المحادثة ويمكننا القيام بأشياء لا تستطيع Apple القيام بها بالضرورة على مستوى نظام التشغيل. وهذا يوفر لنا بعض القيمة. أعتقد أن المنتجات التي ستنجح ستكون المنتجات التي ، كما قلت ، ليست مجرد طبقة سلعة في الأعلى ، ولكنها تفهم بعمق مشكلة أو سير عمل ويمكن أن تدمج ذلك مع وضع البيانات الخاصة بهم.

Emmet: لقد تطرقت أيضًا إلى شيئين ، في الوقت الحالي ، سيكونان مهمين حول القيود. إنه بطيء. يستغرق الرد على الرد ثواني. ستكون هناك بعض المنتجات أو المساحات حيث تكون غير مناسبة. كما أنها مكلفة من حيث قوة الحوسبة وبالتالي فهي مكلفة من حيث المال. ربما تعرف أكثر مني عن هذا الأمر ، لكن كل طلب يكلف بضعة سنتات. تخسر OpenAI الملايين يوميًا لتشغيل ChatGPT ، وربما يستحق ذلك من وجهة نظر العلاقات العامة أو أي بيانات بحثية يحصلون عليها ، ولكن هذا يعني أيضًا أنها لن تكون مجانية وممتعة. وعلى الرغم من أن التكنولوجيا لديها عادة جيدة جدًا وهي أن تصبح أسرع وأرخص بمرور الوقت ، ومن المحتمل أن يحدث هذا هنا ، في الوقت الحالي ، هناك بعض القيود التي تقيد التطبيق. ربما سنراه أقل في تطبيقات الوقت الفعلي. ربما سنراه أقل في تطبيقات B2C ، حيث قد يكون حجم وتكلفة تشغيل هذه الأنواع من الاستعلامات ضخمًا. سيكون من المثير للاهتمام أن نرى كيف تظهر الأشياء هناك أيضًا.

مستقبل التواصل

Emmet: لدي فضول للتعمق أكثر فيما يتعلق بمحادثات التصميم والتفكير فعليًا في هذه الأنظمة التوليدية وكيف سنتفاعل معها. نحن نلمح إلى جميع الحنفيات والضربات الشديدة الجديدة والأشياء التي يمكنك القيام بها عند ظهور نظام أساسي جديد. هذا هو المكان الذي سيتعين علينا حتمًا أن نشق فيه طريقنا إلى عالم التنبؤ. يمكننا جميعًا أن ننظر إلى هذا الأمر في غضون عام أو عامين ونضحك على مدى خطأنا ، ولكن هناك إحساس مثير للاهتمام بأن هذا ربما يتحول نحو طريقة تفاعل تعتمد على النص ، وتقريباً قائمة على سطر الأوامر. هناك نوع آخر من الاتجاهات الدقيقة في المنتج وهو لوحة الأوامر + K التي يمكنك أن تنبثق عن طريق الضغط على اختصار وكتابة الإجراء الذي تريد القيام به. نرى ذلك في الكثير من المنتجات ، مما يساهم في هذا الإحساس العام بالتحول نحو النص واللغة الطبيعية كطريقة مباشرة للتواصل.

"لا أعتقد أنه يتعين علينا اختيار طريقة واحدة للتفاعل مع الذكاء الاصطناعي. إنها قدرة واسعة جدًا يمكن تطبيقها بطرق مختلفة لحالات الاستخدام المختلفة "

من ناحية أخرى ، إذا نظرت إلى الاتجاهات السابقة ، وخاصة الرحلة التي مررنا بها من واجهة سطر الأوامر ، فقد انتهى بنا الأمر إلى إنشاء واجهات مستخدم رسومية مفصلة للغاية في الأعلى. ولذا ، أتساءل عما إذا كنت ستهتم بالتخمين إلى أين ترى هذا الأمر. هل هذا ينذر بتحول نحو المزيد من واجهات سطر الأوامر للقرن الحادي والعشرين؟ هل هذا شيء سطر أوامر مؤقت قبل أن نكتشف كيف تبدو طبقة واجهة المستخدم الرسومية على هذه الأشياء؟ هل من السابق لأوانه القول؟

غوستافس: حسنًا ، أعتقد أنه سيكون لدينا كل هؤلاء. لا أعتقد أنه يتعين علينا اختيار طريقة واحدة للتفاعل مع الذكاء الاصطناعي. إنها قدرة واسعة جدًا يمكن تطبيقها بطرق مختلفة لحالات الاستخدام المختلفة. لذلك ، على سبيل المثال ، إذا كنت تبحث عن إجابة ، فستكون المحادثة هي الطريقة الأساسية للحصول على إجابة. ولكن إذا كنا نتحدث عن زيادة سير العمل باستخدام الذكاء الاصطناعي ، فأعتقد أننا سنرى واجهات رسومية بإجراءات محددة مسبقًا لكي يتخذها الذكاء الاصطناعي. إنه نفس الشيء الذي نراه اليوم مع التلخيص وإعادة الصياغة والموجة الكاملة من مساعد الطيار لـ X.

مع أتمتة سير العمل ، أعني استخدام الذكاء الاصطناعي لتحسين طريقة قيامك بعملك. لذلك ، على سبيل المثال ، في دعم العملاء ، عندما تكتب ردودًا على العملاء باستخدام الذكاء الاصطناعي لتحسين تلك الردود. مرة أخرى ، قم بتوسيع نقطة أو تلخيص المحادثة حتى تلك النقطة. أعتقد أنه يمكن أن تكون هناك واجهات رسومية لتلك الأنواع من زيادة سير العمل.

مولي: أنا فظيع في التنبؤات ، لكن قد يكون لدينا نوع من الانتشار ، كما قلت ، واجهات أوامر + K أو خيارات مختلفة لما يمكنك القيام به. تتمثل إحدى التحديات التي تواجه هذه التقنية في قابلية اكتشاف ما يمكنها القيام به. يمكنك كتابة أي شيء في هذه المطالبة. "اكتب لي قصيدة شكسبيرية مثل القرصان" أو شيء من هذا القبيل. سنضع بعض حواجز الحماية ، لكنني أعتقد أننا ربما نتوسع على الأرجح ثم نرى الأشياء تضيق قليلاً حيث تصبح الأمور أكثر شيوعًا وفائدة. وبعد ذلك ، في النهاية ، ربما تكون قادرًا على الانتقال إلى واجهة قائمة على النص أو المحادثة أو مفتوحة على مصراعيها بمجرد أن يكون لدينا إحساس بما يمكن أن تفعله هذه التقنية.

نظرًا لأننا اعتدنا على التحدث إلى أنظمتنا ، فأنا متحمس أيضًا لإمكانية الواجهات العصبية. لماذا أتحدث عنه إذا كان بإمكاني التفكير فيه؟ أعلم أن هذا بعيد المنال ، لكن عندما كنت في بيركلي ، كان بعض زملائي يعملون على ذلك. سيكون امرا رائعا حقا. هناك الكثير من المواقف التي لا تريد فيها التحدث والكتابة ، وهذا يفتح الأمور. ربما أبعد من ذلك في المستقبل ، سيكون لدينا أنظمة متكاملة يمكنها اتخاذ تعليمات بخلاف واجهة المستخدم الرسومية وترجمتها إلى إجراءات. نحن نرى ذلك بالفعل مع بعض هذه الأنظمة التي يمكنها أخذ استفسارات وإرشادات اللغة الطبيعية وتحويلها إلى إجراءات على جهاز الكمبيوتر الخاص بك. والحقيقة هي أن بعضًا من LLM جيدة أيضًا في إنشاء الكود ، مثل مساعد GitHub. وهكذا ، هناك الكثير من الإمكانات هناك.

Emmet: أظن أن التلاعب بالنص سيحظى بعام رائع في البرنامج لأن هناك الكثير من الاحتمالات الفورية هنا. من الطبيعي جدًا أن تكون قادرًا على إبراز جزء من النص والقول ، "اجعل هذا أكثر ودية". يبدو الأمر كما لو أنه ينتمي إلى لوحة الأدوات جنبًا إلى جنب مع الخط الغامق والمائل. إنها مجرد طريقة لمعالجة النص الموجود. بعد ذلك ، هناك العديد من الطرق للمضي قدمًا في ذلك ، مثل الإنشاء أو إنشاء الكود.

أنا شخصياً وجدت أن تجربة العمل مع مولدات الصور مختلفة تمامًا. مرة أخرى ، يرى الكثير من تجربتنا في هذه الأنظمة أن النتائج يتم تمريرها ، مثل لقطات شاشة ChatGPT أو شيء أنشأه DALL-E أو Midjourney أو Stable Diffusion. تبدو عملية إنشاء مولدات الصور صعبة بالنسبة لي ، وشيء من المحتمل أن يكون مصحوبًا بواجهة المستخدم الرسومية وله واجهة أكثر ملموسًا على الشاشة. من الواضح جدًا أن الاضطرار إلى حشو الموجه باستخدام F-stop يتجه إلى الفن المنحرف لمحاولة الحصول عليه لإنشاء المخرجات التي تريدها. وهناك الكثير من الأبعاد للأنماط المختلفة التي تريد أن تمر بها والتي يمكن تقديمها بشكل أفضل من خلال المقابض والأقراص والمنزلقات من نوع ما. أعتقد أن توقعي هو أننا سنرى الهندسة السريعة كما هي موجودة اليوم يتم استبدالها بشيء أفضل بكثير.

"هناك شيء مثير للاهتمام حول كون الذكاء الاصطناعي مثل زميل ذو قوة خارقة يمكنه استخدام الأدوات التي لديك ويمكنك منحهم تعليقات نصية بسيطة للمساعدة في تحسينها"

وفقط لإنهاء الفكرة ، يختلف الفيديو والصوت اختلافًا كبيرًا لأنه يتعين عليك الجلوس لفترة طويلة ومراجعة النتائج. يمكنك قراءة مائة صورة أو قراءة بعض النصوص ، لكن لدي بصراحة آراء أقل حول ذلك لأنني كنت قادرًا على قضاء وقت أقل في ذلك. لكن أعتقد أن الأمر يعود إلى ما كنت تقوله في النهاية يا جوستافس. إنها ليست إجابة مرضية ، لكنها ستعتمد بشكل كبير. وأعتقد أن الأمر سيعتمد كثيرًا على الشيء الذي أتلاعب به. وقد يكون لدينا واجهات مستخدم مختلفة جدًا لذلك بناءً على ذلك.

غوستافس: في نفس الوقت ، أعتقد أنه ستكون هناك تطبيقات جديدة مثيرة للاهتمام لإعطاء تعليمات اللغة الطبيعية. على سبيل المثال ، هناك شيء واحد وجدناه مثيرًا للاهتمام عندما قمنا باستكشافنا الأولي وهو أن الطريقة التي يمكنك بها تدريب الذكاء الاصطناعي يمكن أن تكون متشابهة جدًا أو متشابهة جدًا أو عمليا كما لو كانت وكيل دعم وستقدم لهم ملاحظات حول سياستك بشأن كيف تتفاعل مع العملاء أو ما هي نبرة الصوت التي يجب استخدامها. حتى عندما تقدم ملاحظات على المحادثات الفردية ، يمكنك فقط إعطاء تلك التعليقات بنص عادي لأنها تفهم اللغة الطبيعية والسياق. أعتقد أننا سنرى ذلك أيضًا. وهناك شيء مثير للاهتمام حول كون الذكاء الاصطناعي مثل زميل يتمتع بقدرة فائقة يمكنه استخدام الأدوات التي لديك ويمكنك إعطاؤهم تعليقات نصية بسيطة للمساعدة في تحسينها.

إيميت: تطرقت مولي إلى ما يحدث عندما لا تنفث هذه الأشياء نصًا فحسب ، بل يمكنها أيضًا اتخاذ إجراءات ، على سبيل المثال. وربما يكون هذا مستوى إضافيًا كاملاً لما يمكنهم فعله.

أين نذهب من هنا؟

مولي: Fergal ، لأولئك منكم الذين يستمعون إلى بعض حلقات البودكاست السابقة ، هو مدير التعلم الآلي. يقول إن نموذجه المثالي لنظام ML يجب أن يكون مثل زميل ذكي يجلس بجانبك يمكنك إعطاء التعليمات له وسينفذها بشكل جيد. هذا نوع من الحلم. وهكذا ، كما قال جوستافس ، القدرة على تقديم ملاحظات اللغة الطبيعية هو مجرد تغيير جذري في كيفية إدارتنا له.

"كيف يمكننا أن نجعل هذا الزميل الذكي الذي يحتمل أن يشكل تهديدًا ، زميلًا في الفريق يجعلك أفضل؟"

إيميت: أتساءل حتى كم من النطاق سيكون هناك. كانت هناك وكالة تسمى بيرج في لندن قبل بضع سنوات ، وقد قاموا بالكثير من التجارب مع التكرارات السابقة للذكاء الاصطناعي. لكن أحد مبادئهم كان "كن ذكيًا مثل الجرو" لأنهم لا يريدون أن يشعر الذكاء الاصطناعي بالتهديد أو الإرهاق. وكان هذا هو مبدأهم في رسم الحدود من حولنا. لا أحب اقتحام المصممين كنوع "لا يمكنك فعل ذلك" ، ولكن ربما يكون وضع تلك الحدود الآمنة دورًا مهمًا للمصممين ليلعبوه أيضًا.

مولي: أعتقد أن هناك دورًا لهذه الحدود. أريد أن أعمل بجانب جرو ، لكن هل تريد العمل بجانب شخص بذكاء جرو؟ أعتقد أن دور المصممين هو: كيف نجعل هذا الزميل الذكي ، الذي يحتمل أن يكون مهددًا ، زميلًا في الفريق يجعلك أفضل ، يمكنه الحصول على جلسة بيضاء رائعة حقًا ، وجلسة عصف ذهني حيث تقوم فقط باستخلاص كل منها آخر؟ كيف نصل إلى ذلك؟ هذا هو المكان الذي يمكننا فيه إضافة هذا السحر حقًا - جعل يوم العمل أفضل ، وزيادة سير العمل ، وجعل الذكاء الاصطناعي زميلًا فعليًا في الفريق.

Emmet: من المحتمل أن تكون السيارات ذاتية القيادة هي التطبيق الأكثر تقدمًا حاليًا للذكاء الاصطناعي ، على الرغم من أنها ليست على مستوى اعتماد واسع. توتر هذه المستويات من القيادة الذاتية والمخاطر المتزايدة مع تقدمك في تلك المستويات - ربما تنطبق نسخة من ذلك على الكثير من هذه الأشياء ، إذا فكرت في الأمر.

مولي: نعم ، أعني ، هذا بالضبط ما ذكرناه بالفعل. هل هو اقتراح؟ هل هناك مراجعة؟ هل هناك موافقة؟ هذا مجرد نسختنا من المستويات الخمسة للمركبات ذاتية القيادة.

غوستافس: شيء آخر مثير للاهتمام هو أنه بمرور الوقت ، عندما يتحسن الذكاء الاصطناعي ويكون قادرًا ليس فقط على تقديم إجابات ولكن أيضًا تنفيذ الإجراءات نيابة عنك ، على غرار ما قد يفعله زميل ، سيكون تحديًا مثيرًا للاهتمام للتصميم طريقة تجعلك تشعر وكأن شخصًا يجلس بجوارك ويساعدك ، بدلاً من مخترق يخطف جهاز الكمبيوتر الخاص بك وينقر على الأشياء. إذا تمكنت من جعلها تعمل مع التصميم ، فستشعر بالسحر. أو يمكن أن يكون مخيفًا بشكل جنوني. سيكون تحدي تصميم مثير للاهتمام.

إيميت: ومن المحتمل أن يكون مسار المحادثة هو أفضل طريقة للقيام بذلك. سيكون من المثير للاهتمام أيضًا رؤية الدرجة التي يتم تأطيرها كشخص ودود ومحادثة مقابل النظام الذي تتفاعل معه عن بعد.

هل ستتغير طبيعة الإنتاج وعمل التفكير كثيرًا؟ هل سيتعين علينا تعلم مهارات جديدة مثل الهندسة السريعة؟ "

قبل عامين ، كان لدينا ، في وقت لاحق ، ما يمكن أن تفكر فيه على أنه دورة ضجيج روبوت. وفي الواقع ، شاركت Intercom بنشاط كبير في التجربة واكتشاف ما يمكننا القيام به. طبعا لدينا منتجات استفادت من ذلك كما ذكرنا سابقا. أشياء مثل Resolution Bot و Custom Bots. لكننا وجدنا أيضًا خلال دورة الضجيج تلك أن هناك مجموعة كاملة من التطبيقات التي ليست جيدة لواجهة مستخدم المحادثة على الإطلاق. كان هناك روبوت للطقس ، وأنت مثل ، "في الواقع ، لست بحاجة إلى روبوت لأسأل عن حالة الطقس - لدي تطبيق أو صفحة ويب مناسبة لذلك." سنرى حتما الكثير من ذلك يحدث هنا أيضًا. ربما يكون التطبيق المفرط لواجهة مستخدم المحادثة ، ولكن بعد ذلك تظهر حالات الاستخدام المفيدة حقًا في المقدمة.

هناك شيء إضافي سأضيفه يجعلني متفائلًا بشأن موضوع المحادثة وهو مشكلة كنا نعمل عليها لفترة طويلة. اختبار تورينج ليس جديدًا. لكن بصرف النظر عن ذلك ، عملت في Google منذ عدة سنوات. كان هناك قدر هائل من العمل في البحث والاعتزاز بجعله يجيب على سؤال مثل ، "كم يبلغ ارتفاع برج إيفل؟" شيء يبدو بسيطًا جدًا مقارنة بما لدينا الآن. حتى المساعدين الصوتيين مثل Siri استيقظوا فجأة ذات صباح في أواخر نوفمبر ليصبحوا عفا عليهم الزمن تقريبًا.

السرعة التي تتحسن بها الأنظمة ستقود جزءًا كبيرًا من هذا أيضًا. أحد الأشياء المثيرة للاهتمام والجديدة للمصممين هو أننا في طريقنا إلى درجة أكبر من العمل مع تقنيات الويب أو أي شيء آخر في الماضي. أين تذهب التكنولوجيا من هنا سوف تملي الأشياء بقدر ما تملي رؤيتنا التأليفية التوجيهية مثل المصممين.

"أعتقد أنه سيكون من المهم حقًا للمصممين الاعتماد على هذا والتلاعب بنماذج اللغة هذه والتلاعب بها ومعرفة كيف يمكنك تطبيقها على منتجك"

البعد الأخير الذي أفكر فيه فيما يتعلق بالتصميم ، على وجه التحديد ، هو الأدوات التي نستخدمها وحقيقة أن لديهم القدرة على التغيير بشكل كبير. هل ستتغير طبيعة الإنتاج وعمل التفكير كثيرًا؟ هل سيتعين علينا تعلم مهارات جديدة مثل الهندسة السريعة؟ Gustavs ، أي أفكار عالية المستوى حول ما يعنيه هذا بالنسبة للطبيعة المتغيرة لعمل التصميم بالفعل؟

غوستافس: أجل. فيما يتعلق بالهندسة السريعة على وجه التحديد ، أعتقد ، بمرور الوقت ، سنرى ظهور أفضل الممارسات لكيفية القيام بذلك بنفس الطريقة التي لدينا مع أي تقنية أخرى. ومن الواضح أنها ستتطور وتتحسن بمرور الوقت ، لكنني لا أعتقد أنها ستكون عاملاً رئيسياً سيشكل عملك بشكل أساسي. من الصعب معرفة كيف سيتغير دور المصمم ، ويعتمد ذلك على الإطار الزمني. على المدى القصير ، أعتقد أنه سيكون من المهم حقًا للمصممين الاعتماد على هذا والتلاعب بنماذج اللغة هذه والتلاعب بها ومعرفة كيف يمكنك تطبيقها على منتجك ، وكيف تقوم الشركات الأخرى بتطبيقها على منتجاتهم ، و حاول أن تجد أنماطًا وطرقًا شيقة للقيام بأشياء جديدة.

ولكن على المدى الطويل ، من الصعب تحديد التأثير الذي سيحدث على المصممين في الصناعة بأكملها. لذلك ، مع تحسن الذكاء الاصطناعي ، ليس فقط في زيادة البشر ، ولكن أيضًا في القيام بالأتمتة الكاملة للكتابة وأداء المهام ، أعتقد أن ذلك يمكن أن يعطل بشكل أساسي الكثير من المنتجات والصناعات وحتى الدور الذي يلعبه المصممون في تشكيل تلك المنتجات. أعتقد أننا سنرى. الكثير من الأسئلة المفتوحة ، وسيكون من المثير للاهتمام أن نرى كيف تسير الأمور.

إيميت: أجل. من الأشياء اللطيفة حول ما نقوم به هو أنه في بعض الأحيان ، تمنحك التكنولوجيا نوعًا جديدًا تمامًا من السبل التي يمكنك متابعتها. هذا بالتأكيد يبدو وكأنه شيء سيغير بشكل كبير المشهد الذي نعمل فيه ويخلق الكثير من التحديات والفرص الجديدة للمصممين. بالنسبة لنا في Intercom ، من المثير جدًا أن نكون جيدًا على طول الطريق وعلى هذا المسار وأن نكون ملتزمين به تمامًا. سيكون عامًا مثيرًا للاهتمام بالنسبة للذكاء الاصطناعي والتصميم باستخدام الذكاء الاصطناعي ، بلا شك. إنني أتطلع إلى رؤية أين نصل إليه. ربما يمكننا ترك الأمر عند هذا الحد. مولي ، شكرا جزيلا لك. غوستافس ، شكراً مليوناً. لقد كان من الرائع الدردشة معك والتعلم من تجربتك السابقة في العمل باستخدام هذه التقنية. ربما سنفعل ذلك مرة أخرى عندما نكون أكبر سنًا وأكثر حكمة ، لكن في الوقت الحالي ، شكرًا جزيلاً.

بودكاست انتركم داخلي (أفقي) (1)