ИИ в наборе инструментов дизайнера: формирование будущего с помощью ChatGPT

Опубликовано: 2023-02-08

По мере того, как GPT поднимает планку, а большие языковые модели становятся все более изощренными, какие новые горизонты откроются для дизайнерского мышления? И как они изменят традиционную роль дизайнеров продуктов?

Запуск ChatGPT вызвал вихрь мнений и дискуссий, и самые разные люди участвовали в горячем обмене мнениями о том, что все это значит для нас. Теперь мы первые, кто признал, что предсказания и спекулятивное прогнозирование могут быть дурацкой затеей, но одно можно сказать наверняка — эти модели уже вызывают сейсмический сдвиг в том, как мы думаем о наших продуктах и создаем их.

Если вы слушали Inside Intercom на прошлой неделе, то знаете, что мы быстро подхватили GPT, разработали новые функции на основе искусственного интеллекта и отправили их 160 пользователям бета-версии (не стесняйтесь ознакомиться с первой и второй частями). два разговора, если вы еще этого не сделали). Сегодня, для последней части наших чатов GPT, к нам присоединились некоторые из людей, которые действительно занимались прикладным проектированием с ChatGPT и большими языковыми моделями для создания реальных продуктов, которые решают реальные проблемы для клиентов.

В этом выпуске вы услышите от нас самих:

Эммет Коннолли, вице-президент по дизайну продукции
Молли Махар, штатный дизайнер продуктов в команде машинного обучения
Густавс Цирулис, старший главный дизайнер продукции

Они расскажут о больших языковых моделях (LLM), таких как ChatGPT, и о том, как они будут определять роль дизайнера продукта в ближайшие годы. Мы не можем знать, что принесет будущее, но если вы спросите нас, лучшее, что вы можете сделать, это положиться на него.

Вот некоторые из основных выводов:

GPT действительно хорош для обобщения контента, понимания языка и редактирования текста. Но главная проблема в том, что иногда его ответы кажутся правдоподобными, но фактически неверны.
По мере развития технологий организации поддержки будут переходить от реактивных к упреждающим действиям, обучая ИИ и обеспечивая поддержку в разговорной форме, которая кажется людям естественной.
Могут появиться новые шаблоны проектирования для управления неопределенностью и ожиданиями, такие как встраивание оценок достоверности в функции.
Со временем предприятия смогут использовать модели с открытым исходным кодом и создавать уровни поверх специализированных знаний, используя собственные данные своей отрасли или компании.
В будущем взаимодействие с ИИ может включать диалоговые интерфейсы, графические интерфейсы для расширения рабочего процесса и даже нейронные интерфейсы.
Роль дизайнера будет заключаться в создании интерфейса ИИ, который будет функционировать как интеллектуальный, безопасный коллега, способный дополнить ваш рабочий процесс и облегчить ваш день.

Следите за новостями Inside Intercom в Apple Podcasts, Spotify, YouTube или загружайте RSS-канал в выбранном вами проигрывателе. Далее следует слегка отредактированная стенограмма эпизода.

Первые встречи

Эммет Коннолли: Всем привет. Добро пожаловать на подкаст Inside Intercom. Я очень рад, что сегодня к нам присоединятся Молли и Густавс из группы разработки продуктов Intercom. С момента запуска ChatGPT несколько недель назад было много горячих дискуссий, много случайных спекуляций и много кабинетных размышлений о том, что все это значит. Я бы сказал, что большинство из них исходит от людей, которые на самом деле вообще не работали напрямую с технологией, поэтому я очень рад сегодня поговорить с Молли и Густавсом. Потому что Молли и Густавс — двое из довольно крохотного меньшинства во всем мире, которые на самом деле проделали настоящую работу по прикладному дизайну продукта с помощью ChatGPT и связанных с ним технологий. Я имею в виду фактическое использование его для интеграции с продуктами и решения реальных проблем с продуктами для клиентов с реальными продуктами, работающими в масштабе. Итак, Молли и Густавс, добро пожаловать на шоу. Может быть, вы хотели бы представиться очень кратко. Молли, ты хочешь пойти?

Молли Махар: Конечно, конечно. Я Молли Махар. Я штатный дизайнер в Intercom. Я довольно новый. Я работаю в команде машинного обучения, в команде инженеров, и мы много занимаемся прототипированием.

Густавс Цирулис: Привет, я Густавс. Я главный дизайнер продуктов и работаю здесь немного дольше, чем Молли. Я был повсюду, но в данный момент я работаю в команде роста.

«Это напомнило мне поведенческую экономику в колледже и эффект Даннинга-Крюгера, когда ты некомпетентен, но самоуверен».

Эммет: Сегодня мы поговорим об искусственном интеллекте и больших языковых моделях, таких как ChatGPT. В частности, о том, что они значат для дизайна и дизайнеров. Мы немного поговорим о том, какие новые возможности открываются для дизайнеров, в частности, с этой новой технологией, каково это для вас или чем отличается работа с ИИ по сравнению с традиционными продуктами, а также о некоторых проблемах, с которыми вы столкнулись при работе. начали разрабатывать эти функции на основе ИИ. В какой-то момент мы можем даже прибегнуть к опрометчивым предсказаниям. Но давайте начнем с основ. Молли, какова была твоя первая реакция, когда всего несколько недель назад появился ChatGPT, который произвел довольно большой фурор? До этого вы довольно долго работали с системами искусственного интеллекта и машинного обучения.

Молли: Ну, во-первых, меня засыпало множеством скриншотов в Slack, и я начала видеть их от людей со всей компании, в Твиттере и везде. Я попробовал и подумал: «Это очень круто. Это тоже очень умно». Большие языковые модели (LLM) существуют уже некоторое время, но теперь они добавили пользовательский интерфейс в свой API. И поэтому все больше людей во всем мире могут использовать их, не будучи разработчиками или кем-то еще, что, я думаю, довольно круто и показывает, насколько люди были в восторге от них. Я начал играть с ним, и это действительно мощно.

Вы можете задать ему много вопросов, вы можете следить. Это действительно удивительно. Такое ощущение, что это какой-то разговор. Затем мы начали, как команда, копаться в этом, чтобы попытаться провести стресс-тестирование. И я почувствовал, что начинаю видеть шумиху. Это напомнило мне поведенческую экономику в колледже и эффект Даннинга-Крюгера, когда вы некомпетентны, но самоуверенны. И мне иногда казалось, что это так. Этот ChatGPT умеет нести чушь намного лучше, чем я. Я поражен этим. И так, я прошел через волну чувств по этому поводу. Интересно, было бы полезно дать краткий обзор LLM.

«LLM существуют уже некоторое время, становясь все лучше и быстрее и быстрее. Удивительная вещь в ChatGPT заключается в том, что я как человек действительно могу его использовать».

Эммет: Думаю, да. Я думаю, что у многих людей ChatGPT ассоциируется с ИИ, о котором все говорят. Итак, не могли бы вы объяснить простым языком, что такое ChatGPT и как это связано с другими терминами, такими как большие языковые модели, о которых люди могли слышать?

Молли: Да, я сделаю все возможное. Итак, большие языковые модели, сокращенно LLM, — это модели, обученные на огромном корпусе общедоступных текстов отовсюду — книги, Интернет, мультимодальные источники, я думаю, иногда. Миллиарды, миллиарды и миллиарды фрагментов данных внутри. И они часто тренируются с обратной связью от человека. Я думаю, что это объясняет, почему вы можете вести этот разговор с ChatGPT — вы можете дать ему обратную связь, и он действительно отреагирует на это и изменит свои ответы. LLM существуют уже некоторое время, становясь все лучше и быстрее и быстрее. Удивительная вещь в ChatGPT заключается в том, что как человек я действительно могу его использовать. А во-вторых, это действительно очень, очень хорошо. ChatGPT — это, по сути, внешний интерфейс, и я немного упрощаю это, но это внешний интерфейс для API большой языковой модели, который OpenAI использует в фоновом режиме. И у них есть несколько таких.

Есть много других компаний, у которых также есть большие языковые модели. Google работает над LaMDA, есть и другие компании. Итак, сегодня мы могли бы сказать ChatGPT, но мы имеем в виду эту технологию в целом. На самом деле мы работаем с API-интерфейсами, а не с ChatGPT, который сейчас доступен только через пользовательский интерфейс.

«Раньше это было просто типа: «Эй, сгенерируй мне это стихотворение о чем угодно». Теперь вы можете вести двусторонний разговор. Вот как люди взаимодействуют друг с другом»

Эммет: Ага. И я думаю, что одна из интересных вещей в ChatGPT заключается в том, что в некотором смысле это не так уж ново с технической точки зрения. ChatGPT — это приложение, созданное с использованием GPT-3.5 компанией OpenAI. Но GPT-3.5 существует уже некоторое время — несколько месяцев, верно, Молли? Итак, мне любопытно. Густавс, какова была ваша реакция? Как вы думаете, почему реакция на то, что мы видим с ChatGPT, отличается от базовой технологии, которая была доступна в течение некоторого времени?

Густавс: Я думаю, что большая разница в том, что презентация похожа на беседу, где вы можете задавать дополнительные вопросы и углубляться. Раньше это было что-то вроде: «Эй, напиши мне это стихотворение о чем угодно». Теперь вы можете вести двусторонний разговор. Так люди взаимодействуют друг с другом. Таким образом, это более знакомо, чем одноразовая подсказка. Когда я играл с ChatGPT, когда он только вышел, это было похоже на волшебство. Было действительно трудно поверить, что это существует. И я просто продолжал играть с ним, говорить на разные темы, и мне казалось, что у меня есть личный репетитор по запросу, который знает все обо всем. В нем говорилось о самых разных вещах из технологий, истории, психологии и даже комедии. Оказывается, он действительно хорош в создании стендап-комедии, если вы дадите ему хорошую подсказку. Было очень весело делать это.

Случай с галлюцинациями

Эммет: Вы оба работали над этим несколько недель. У всех нас была очень впечатляющая первоначальная реакция, но, потратив несколько недель, пытаясь применить это к реальным проблемам клиентов, возможно, пытаясь как-то напрямую применить это, выдерживает ли это шумиху, Густавс?

Густавс: Ага. Как только вышел ChatGPT, мы были очень впечатлены и поняли, что должны лучше понять, что это значит для нашего бизнеса. Казалось, что это может оказать действительно значимое влияние на всю индустрию обслуживания клиентов, поэтому мы сформировали небольшую рабочую группу и изучили, в чем хорош ChatGPT, в чем он плох и что он может значить для нашего бизнеса. После выполнения этого упражнения мои собственные страхи, тревоги и ажиотаж немного поутихли. Кажется, технологии еще не совсем готовы взять на себя нашу работу и все автоматизировать.

«Модель хочет доставить вам удовольствие, поэтому она хочет дать вам ответ, который, по ее мнению, вы хотите»

Оказывается, он действительно хорош в чем-то, но не во всем. Например, он хорош в таких вещах, как обобщение содержания или понимание языка, редактирование и творческое письмо. Но у него есть серьезный недостаток галлюцинаций, когда он просто выдумывает вещи, которые кажутся очень реальными, но на самом деле неверны, что, очевидно, является большой проблемой для решения по обслуживанию клиентов. Вы не хотите давать правдоподобно звучащие, но фактически неверные ответы. Но есть много интересных вещей, к которым вы можете применить его. И я думаю, что главный вывод заключается в том, что эта технология развивается очень быстро. И это действительно только вопрос времени, когда он сможет давать фактически правильные ответы. И как только это произойдет, это будет действительно разрушительно.

Эммет: То есть ты хочешь сказать, что это даст ответ, несмотря ни на что. И в некоторых случаях это приводит к тому, что вы назвали галлюцинациями. Молли, это кажется большим ограничением для тех, кто пытается использовать это по-настоящему. Что такое галлюцинации и почему они вообще возникают?

Молли: Да, это огромная проблема, как сказал Густавс. Модель хочет доставить вам удовольствие, поэтому она хочет дать вам ответ, который, по ее мнению, вам нужен. Иногда у него есть надежный источник этой информации, а иногда это просто выдумка. Это похоже на ребенка. "Зачем ты это сделал?" — Ну, я думал, это то, чего ты хотел. Галлюцинация может исходить из множества разных источников. Если вы зададите ему вопрос об Intercom, он не обязательно узнает что-то новое. Таким образом, он может брать фрагменты того, что ему известно, которые являются точными, общие знания из других источников, интерполировать их и, в некотором смысле, пытаться использовать здравый смысл, которого у него, конечно же, нет. У него действительно нет способностей к рассуждению. Он использует такие вероятности, как: «Ну, это, вероятно, может работать таким образом, поэтому я могу придумать ответ о чем-то об API Intercom» или что-то в этом роде. И, как сказал Густавс, это очень правдоподобно. Звучит очень уверенно.

И, как вы упомянули, разные компании фокусируются на разных вещах. Есть компании, которые уделяют немного больше внимания тому, как свести к минимуму галлюцинации. Принимая во внимание, что ChatGPT, я думаю, часто уделяет большое внимание ограждениям и этике и ясности в отношении того, на что он отказывается отвечать.

Эммет: Как вы думаете, мы увидим множество и множество различных моделей, и вы сможете выбрать ту, которая лучше всего подходит для компромисса между абсолютной правильностью и галлюцинациями, которые вы хотите, или это проблема, которая может просто исчезают, когда модели взрослеют?

«ChatGPT продемонстрировал кое-что интересное, а именно то, что пользовательский интерфейс и UX всего этого очень важны»

Молли: Я не уверена, что он исчезнет. Но да, моделей уже много. Существуют модели с открытым исходным кодом, и есть потенциал для того, что мы называем тонкой настройкой поверх модели. GPT означает генеративный предварительно обученный преобразователь, поэтому он генерирует вещи. Он предварительно обучен на большом корпусе и трансформерах. Разные компании будут фокусироваться на разных вещах. Существуют модели с открытым исходным кодом, и Intercom, как потенциальный пользователь этих моделей, может иметь возможность тонкой настройки сверху, чтобы получить более специализированные знания о нашей отрасли или компании. Технология также улучшит использование и потребность в меньшем количестве данных для создания отличной модели. Таким образом, модели будут становиться все меньше и меньше и меньше. И потенциально, в этот момент для небольшой компании может быть намного разумнее создать модель на своих данных и сделать ее достаточно специализированной, хорошо осведомленной и очень надежной.

Эммет: Давайте сменим тему и поговорим более конкретно о дизайне. Очевидно, что GPT и ИИ в целом были прежде всего историей технологий, но я думаю, что ChatGPT продемонстрировал кое-что интересное, а именно то, что пользовательский интерфейс и UX всего этого очень важны. Например, потенциально наблюдается сдвиг в сторону разговорных интерфейсов. Как вы думаете, это правда? Какова роль дизайна в формировании того, что мы делаем с этой технологией, Молли?

Молли: Я имею в виду, что у Интеркома очень хорошие позиции. Наш бизнес — это беседы и обслуживание клиентов, и людям очень нравится общаться с этой технологией. Но что мы недавно обнаружили, так это то, что, по крайней мере, на данный момент, в технологии доступно так много возможностей, которые на самом деле не напрямую связаны с разговором, а с разговором и языком.

Как мы уже упоминали, он отлично подходит для суммирования, и существует множество рабочих процессов, в которых суммирование действительно может помочь агентам по обслуживанию клиентов. Недавно мы запустили бета-версию для некоторых клиентов, и обобщение — это одна из вещей, которые люди находят очень, очень, очень ценной. Мы также добавили несколько генерирующих текстовых инструментов, позволяющих представителям вносить изменения в свои сообщения, если они хотят перефразировать вещи, сделать их более дружелюбными, сделать их немного более формальными или получить помощь в разъяснении вещей. Это часть разговора, но это не прямой разговор с ChatGPT. Мы также находим его полезным для помощи в создании таких вещей, как статьи справочного центра, которые также были частью этой бета-версии. Большая сила этого заключается в некоторых более скрытых приложениях, которые не так очевидны для неспециалистов, но действительно отнимают много времени у торговых представителей. И мы можем обеспечить большую ценность с этим.

«Вы ищете пересечение вещей, в которых технология хороша, и вещей, где существует относительно низкий риск. И мы увидим много таких в ближайшие месяцы».

Густавс: Ага. Есть много способов использовать эту технологию, и благодаря этому обойти некоторые из проблем, которые мы видели, особенно с галлюцинациями, когда они выдумывают что-то неправильное. Но он действительно хорош в других вещах. Это хорошо для переформулировки существующего контента, и имеет смысл использовать его, потому что он может принести четкую ценность. Конечная цель состояла бы в том, чтобы быть полностью автоматизированным и фактически давать ответы. Просто технологии для этого еще недостаточно хороши. Но я думаю, что мы доберемся до этого.

Эммет: И я подозреваю, что именно так мы будем видеть вещи в течение 2023 года, потому что я полагаю, что мы начнем видеть, как это пробирается во множество различных продуктов, вероятно, относительно простыми, надежными способами для начала, а затем все больше выталкивая лодку. с точки зрения сложности того, что он может сделать. Мы все, я думаю, подошли к этой возможности с сочетанием волнения и, может быть, немного здорового трепета. Молли, вы упомянули, что в настоящее время эти функции поддерживаются ChatGPT в бета-версии. И отзывы были очень воодушевляющими и положительными. Самые ранние признаки, которые мы видим, это то, что реальные клиенты получают реальную пользу от таких функций, как подведение итогов разговора, прежде чем передать его кому-то другому. Вы ищете пересечение вещей, в которых технология хороша, и вещей, где существует относительно низкий риск. И мы увидим много таких в ближайшие месяцы. Так что это будет захватывающе.

Разговорный ИИ

Эммет: Густавс, ты думал об этом больше в долгосрочной перспективе. Не могли бы вы немного поговорить об этом? Вы упомянули Intercom – одна из причин, по которой мы здесь говорим об этом, заключается в том, что мы, вероятно, располагаем достаточно хорошими возможностями, учитывая характер наших продуктов, то есть диалоговое обслуживание клиентов, чтобы максимально использовать это. Что вы думаете, когда думаете о долгосрочных возможностях продукта и дизайна?

Густавс: В самые первые дни запуска ChatGPT мы провели этот семинар, чтобы попытаться подумать о будущем, особенно о том, как бы выглядел мир, если бы у нас была модель, у которой не было бы этой проблемы с галлюцинациями и которая могла бы дать хорошие ответы или сказать «Я не знаю». Это было действительно многообещающе, и это действительно увеличило нашу уверенность во многих вещах, в которые мы уже верили, но которые ускоряются. Мы считаем, что большинство запросов в службу поддержки будут решаться полностью автоматически, без общения с людьми. Сегодня он уже увеличивается с появлением большего количества конструкторов типа «если это, то это», с ботами и нашим собственным ботом разрешения, который имеет некоторые возможности машинного обучения, но не в такой степени, как ChatGPT.

«Большая часть поддержки будет оказываться наиболее естественным для людей способом, то есть посредством разговора».

Мы уже на этом пути, но он будет ускоряться. И в результате этого организации поддержки начнут переходить от реактивных действий и, прежде всего, входящих сообщений к активным действиям — настройке и обучению ИИ; написание контента, который ИИ может использовать для разрешения разговоров.

Я думаю, что большая часть поддержки будет происходить наиболее естественным для людей способом, то есть посредством разговора. Представьте, если бы у вас был человек, с которым вы всегда можете поговорить, и у которого есть индивидуальный ответ именно для вас. Это самый естественный способ взаимодействия людей. Этот опыт поиска и просмотра, который мы имеем сегодня, когда вы ищете что-то в Google и сканируете это, чтобы попытаться быстро найти ответы где-то в содержании, не так уж естественен для людей. По-прежнему будут некоторые версии этого с предложениями по содержанию, которое может быть актуально для вас, прежде чем вы начнете разговор. Но когда вы взаимодействуете с ним, он все еще может быть разговорным.

Мы считаем, что нам также необходимо построить мост, чтобы добраться туда по нескольким причинам. Я думаю, мы начнем с того, что увидим увеличение количества представителей службы поддержки с помощью таких вещей, как обобщение или перефразирование. Позже мы получим предложения по ответам, которые представители службы поддержки смогут редактировать и улучшать, а позже мы перейдем к полной автоматизации. Потребуется некоторое время, как для технического, так и для человеческого аспекта, чтобы привыкнуть к использованию все большей и большей автоматизации.

Эммет: Вы описываете что-то, где на очень широкой поверхности продукта есть много разных мест, где это может изменить то, как мы работаем, как то, что мы называем взаимодействием с командой, так и взаимодействием с конечным пользователем, в двух аспектах. стороны разговора. Но вы также описываете это туманное представление о том, как мы собираемся добраться до этого неопределенного будущего «мы думаем, что технологии туда доберутся». Мне кажется, что это совершенно другой способ мышления о подходе к дизайну сегодня и почти глубокая разница в том, как мы думаем о взаимодействии с компьютерами, переходя от чего-то очень детерминированного, очень жесткого — истинного и ложного, единиц и нулей — к чему-то другому. намного размытее.

Новые шаблоны проектирования

Эммет: Сейчас дизайнеры рассматривают возможность работы с этим материалом, который кажется более непостижимым, пластичным и менее жестким, чем приложения CRUD, «создавать, писать, обновлять, удалять», к которым мы привыкли. Что вы нашли? Есть ли существенная разница в том, как дизайнеры должны подходить к своей работе? Вы нашли определенные вещи трудными или сложными? Придется ли дизайнерам осваивать новые навыки? Насколько велико это изменение для акта проектирования, тот факт, что материал, который мы проектируем, почти содержит этот элемент непознаваемости?

«Со временем мы увидим появление все новых и новых шаблонов проектирования, позволяющих управлять этой неопределенностью и ожиданиями со всех сторон».

Молли: Я думаю, что многое в нашей работе останется прежним. Мы находим проблемы, копаемся в рабочих процессах людей, находим закономерности. Одна большая вещь заключается в том, что нужно разработать гораздо больше случаев отказа, потому что не обязательно есть ограждения. Когда вы ведете беседу, она может выйти из-под контроля самыми разными способами. И то же самое с такой системой. Люди, как вид, не сильны в вероятностях. Когда мы смотрим на отчет о погоде и видим, что вероятность дождя составляет 40%, мы не очень понимаем, что это значит.

Эммет: Да, ты расстраиваешься, если не идет дождь, потому что тебе сказали, что дождь будет.

Молли: Ага. Я в Нидерландах – когда я вижу малейшую вероятность дождя, я такой: «Дождь будет. Вопрос только в том, как долго». Вот что для меня значат проценты. Но мы не так хороши в их интерпретации. Я думаю, что это определенно будет что-то, поскольку мы посмотрим, насколько надежны эти предсказания, потому что они предсказывают, какие слова должны быть следующими. И мы постараемся стать лучше в этом. Есть много проблем с тем, как быстро эта технология движется и меняется, и я не думаю, что это изменится. Существует много прототипов, реакций и размышлений о задержке. Задержка прямо сейчас может быть довольно большой — это предусмотрено. И очень много неожиданных результатов. Это некоторые из вещей, которые я заметил.

Густавс: Думаю, со временем мы увидим появление все новых и новых шаблонов проектирования, позволяющих справляться с этой неопределенностью и ожиданиями со всех сторон. На данный момент все экспериментируют и смотрят, что работает. Мы уже видим появление некоторых шаблонов с небольшими предопределенными подсказками о том, как изменить текст, например «расширить это», «обобщить это», «сделать его более удобным». Это относительно новый паттерн, который начинает появляться, и я думаю, что мы увидим все больше и больше таких паттернов. Даже это взаимодействие, когда, если вы попросите ChatGPT сгенерировать контент, у него будет этот медленно движущийся курсор. Это тоже интересный шаблон дизайна. Это технически необходимо, но может работать очень хорошо, чтобы создать ожидания, что «эй, это ИИ, генерирующий контент на лету».

«В этих новых системах, которые могут быть очень автоматизированными, думаем ли мы о том, чтобы добавить некоторые трения, чтобы сохранить навыки, которые кажутся ценными и которые мы хотим иметь?»

Эммет: Итак, вы говорите, что этот эффект набора текста слово за словом, который, если быть ясным, зависит от того, как технология составляет слово за словом, может стать синонимом и визуальной визитной карточкой. . Может быть, это произойдет, а может и нет, но тип вещей, которые имеют тенденцию возникать, когда мы видим эти сдвиги и появление новых технологий, может быть интересным, чтобы углубиться в идею появления новых шаблонов проектирования, потому что мы видим это, когда появляются новые технологии. вдоль. Молли, есть ли другие, с которыми вы сталкивались, либо на очень низком уровне дизайна взаимодействия, либо на высоком уровне того, как это встраивается в продукты?

Молли: Есть еще пара вещей, которые, я думаю, станут появляться чаще. Например, когда мы пытаемся разработать функцию, инженеры проводят тестирование на истории. Они используют прошлые данные и делают прогнозы на их основе, а затем сравнивают их с тем, что на самом деле сказал, например, товарищ по команде. Для подобных вещей нам может понадобиться начать запуск не на стороне конечного пользователя, а на стороне товарища по команде или администратора, когда люди, управляющие организацией CS, могут захотеть иметь то, что я называю темным запуском — у них нет живых вещей, но они способен наблюдать за ними и чувствовать: «Хорошо, теперь я верю, что это пройдет». Разные этапы темного запуска, черновые предложения и разные этапы запуска некоторых из этих инструментов. Я думаю, это будет более заметным.

Я не знаю, в каком направлении это пойдет, но я думаю о моментах, когда нам, возможно, придется снова добавить трения в систему, чтобы мы не чувствовали самоуспокоенности. Пилоты по-прежнему выполняют определенные части полета, хотя большую часть этого делает система автопилота, потому что им нужно не забывать, как летать. Итак, они занимаются посадкой или другими вещами. В этих новых системах, которые могут быть очень автоматизированными, не думаем ли мы о том, чтобы добавить некоторые трения, чтобы сохранить навыки, которые кажутся нам ценными и которые мы хотим иметь?

Эммет: И очевидно, что почти все имеет неявную оценку достоверности для встроенной функции, которую вам нужно разработать. Мы хотели бы рассказать об этом представителям и администраторам или их клиентам? Для нас существует более высокий порог для предоставления материалов их клиентам или даже на более низком уровне детализации. Воспользуйтесь умением подводить итог длинному разговору. Вы публикуете это резюме прямо в ветке обсуждения одним нажатием кнопки или даете кому-то возможность просмотреть и одобрить его? Пропустить напрямую или добавить ворота утверждения? Я думаю, что мы, вероятно, увидим множество рабочих процессов, по крайней мере, на начальном этапе, а затем они просто начнут отваливаться по мере того, как технология становится все более и более уверенной в себе?

Молли: Да, точно.

Густавс: Даже просто способность сказать вам, насколько он уверен. Если бы ИИ мог сказать вам: «Эй, это мой ответ, и он правильный на 40%», вы могли бы представить его на утверждение человеку, прежде чем он будет отправлен. Если он уверен на 90%, вы можете просто отправить его прямо сейчас и иметь кнопку «Эй, это неправильно» на стороне конечного пользователя. Это действительно зависит от того, как развивается технология. Дизайн должен будет развиваться вместе с ним.

Эммет: Ага. Боже, дай мне уверенность в большой языковой модели, потому что она будет абсолютно уверенно говорить полную ложь и полную правду, не делая различий между ними. И это дело доверия. На данный момент нет ничего, что говорило бы: «Я на 100% уверен в этом утверждении». По крайней мере, в ChatGPT. Я полагаю, что в некоторых других языковых моделях мы начинаем видеть ссылки на источники, что кажется положительным шагом.

Добавление слоев сверху

Эммет: Кажется, что есть много неизвестных вещей, много мельчайших, глубоких дизайнерских решений, подобных этому, в которые нужно вмешиваться. Давайте уменьшим масштаб до того, что эти мегатенденции означают для дизайна и продукта. Люди были свидетелями или участниками появления больших новых технологий. Я думаю о таких вещах, как облачные технологии или массовый переход на веб-сайты и мобильные устройства, как о крупных передовых технологиях, которые привели к появлению совершенно нового мира шаблонов проектирования и продуктов, которых раньше не было. В облаке мы увидели формы, ленты, лайки и все визуальные преобразования, через которые прошла сеть.

То же самое можно сказать и о мобильных устройствах — все, начиная от каналов и гамбургер-меню, заканчивая обновлением и удалением, которые мы теперь считаем частью набора инструментов дизайнера. Может быть, мы приближаемся к моменту предсказания опасно близко, но каков ваш ранний опыт работы с этим? Говорит ли он вам что-нибудь о том, какие типы продуктов выиграют или проиграют, и какие новые вещи, которые мы могли бы увидеть, появляются, которые раньше были даже невозможны?

«Я думаю, что компании, которые выиграют, будут иметь какие-то проприетарные данные и эффект маховика, который будет постоянно собирать и улучшать эти данные».

Густавс: Я думаю, что со временем большинство компаний будут использовать общедоступные большие языковые модели вместо того, чтобы создавать свои собственные. Но чтобы отличаться друг от друга, они могут создавать над ними слои со специальными знаниями. Например, у вас могут быть данные, относящиеся к бизнесу — для инструмента поддержки это могут быть ответы на конкретные вопросы о вашем продукте, а представители службы поддержки дают конкретные ответы, а не общие знания. Это могут быть действительно глубокие познания в какой-то области, например, в юриспруденции.

Я думаю, что компании, которые выиграют, это те, у которых будут какие-то проприетарные данные и эффект маховика, который будет постоянно собирать и улучшать эти данные. Еще одна вещь, которая, как мне кажется, будет интересной, — это посмотреть, что крупные игроки, такие как Google, Apple и Microsoft, делают с этой технологией и как они интегрируют ее на уровне ОС. Это может оказать огромное влияние на то, какие ниши доступны для других предприятий.

«OpenAI теряет миллионы долларов в день на запуск ChatGPT, и, вероятно, это того стоит с точки зрения PR или каких-либо исследовательских данных, которые они собирают, но это также означает, что он не будет бесплатным и праздным».

Эммет: Вы начали с того, что сказали, что большинство людей собираются определенным образом интегрировать эти большие языковые модели. Я думаю, что предприятия, которым не удается сделать то, о чем вы говорили, и которые на самом деле находят какой-то защитный ров, окажутся в основном тонкой оболочкой над GPT, которая на самом деле не делает многого другого. Так что тут я с вами полностью согласен. Если вы думаете о чем-то вроде App Store или магазинов мобильных приложений, в первые дни было много игрушек, фонариков и тому подобного. А затем, постепенно, он вытряхивается в большие возможности, такие как Uber, которых не было бы, если бы у нас не было этой модели, Instagram, карты и так далее. Молли, что бы вы хотели добавить, основываясь на своем опыте?

Молли: Я не совсем уверена, что все будут использовать публичные LLM. Я немного опасаюсь, что они либо будут слишком дорогими для многих компаний, чтобы их бизнес-модель работала, либо некоторые из крупных компаний могут оставить их частными. Так что я не уверен, будут ли все использовать общедоступные или люди будут больше двигаться в сторону открытого исходного кода и поставят свой тонкий слой сверху. Я согласен с режимами данных. Например, в Intercom у нас есть много данных о разговорах, и мы можем делать то, что Apple не всегда может делать на уровне ОС. И это дает нам некоторую ценность. Я думаю, что успешными будут продукты, которые, как вы сказали, не просто товарный слой сверху, но глубоко понимают проблему или рабочий процесс и могут интегрировать это со своим режимом данных.

Эммет: Вы также затронули пару моментов, которые на данный момент будут важны в связи с ограничениями. Это медленно. Ответ занимает несколько секунд. Будут некоторые продукты или места, где это просто не подходит. Это также дорого с точки зрения вычислительной мощности и, следовательно, дорого с точки зрения денег. Вы, наверное, знаете об этом больше меня, но каждый запрос стоит пару центов. OpenAI теряет миллионы долларов в день на запуск ChatGPT, и это, вероятно, того стоит с точки зрения PR или каких-либо исследовательских данных, которые они собирают, но это также означает, что он не будет бесплатным и праздным. И хотя технология имеет очень хорошую привычку становиться быстрее и дешевле с течением времени, и это потенциально может произойти здесь, на данный момент существуют определенные ограничения, которые ограничивают применение. Возможно, мы будем реже видеть это в приложениях реального времени. Возможно, мы будем меньше видеть это в приложениях B2C, где масштаб и стоимость выполнения таких запросов могут быть огромными. Будет интересно посмотреть, как там будут развиваться события.

Будущее интерфейсов

Эммет: Мне любопытно углубиться в разговор о дизайне и подумать об этих генеративных системах и о том, как мы будем с ними взаимодействовать. Мы имеем в виду все новые тапы, свайпы и другие вещи, которые вы сможете делать, когда появится новая платформа. Здесь нам неизбежно придется пробираться на цыпочках в мир предсказаний. Мы все можем оглянуться на это через год или два и посмеяться над тем, насколько мы ошибались, но есть интересное ощущение, что, возможно, это смещается в сторону более текстового, почти основанного на командной строке способа взаимодействия. Еще одним видом микротренда в продукте была эта палитра «команда + K», которую вы можете открыть, нажав ярлык и введя действие, которое хотите предпринять. Мы видим это во многих продуктах, что способствует общему ощущению перехода к тексту и естественному языку как прямому способу взаимодействия.

«Я не думаю, что мы должны выбирать какой-то один способ взаимодействия с ИИ. Это очень широкая возможность, которую можно применять по-разному для разных вариантов использования».

С другой стороны, если вы посмотрите на предыдущие тенденции, особенно на путь, который мы прошли с интерфейсом командной строки, мы закончили тем, что создали очень подробные графические пользовательские интерфейсы поверх них. Итак, мне интересно, не могли бы вы порассуждать о том, куда, по вашему мнению, все это идет. Предвещает ли это переход к большему количеству интерфейсов командной строки в 21 веке? Является ли это временной вещью командной строки, прежде чем мы выясним, как выглядит слой графического пользовательского интерфейса для этих вещей? Чертовски рано говорить?

Густавс: Ну, я думаю, у нас все это будет. Я не думаю, что мы должны выбирать какой-то один способ взаимодействия с ИИ. Это очень широкая возможность, которую можно применять по-разному для разных вариантов использования. Так, например, если вы ищете ответ, разговор будет основным способом получить ответ. Но если мы говорим о расширении рабочего процесса с помощью ИИ, я думаю, мы увидим графические интерфейсы с предопределенными действиями для ИИ. Это то же самое, что мы видим сегодня с подведением итогов, перефразированием и целой волной второго пилота для X.

Под автоматизацией рабочего процесса я имею в виду использование ИИ для улучшения вашей работы. Так, например, в службе поддержки клиентов вы пишете ответы клиентам, используя ИИ для улучшения этих ответов. Опять же, расширяя точку зрения или резюмируя разговор до этого момента. Я думаю, что могут быть графические интерфейсы для такого расширения рабочего процесса.

Молли: Я ужасен в предсказаниях, но у нас может быть некоторое распространение, как вы сказали, интерфейсы command + K или различные варианты того, что вы можете сделать. Одной из проблем с этой технологией является обнаружение того, что она может сделать. Вы можете ввести что угодно в это приглашение. «Напиши мне шекспировскую поэму, как пират», или что-то в этом роде. Мы поставим некоторые ограждения, но я думаю, что мы, вероятно, будем расширяться, а затем увидим, что вещи немного сужаются по мере того, как вещи становятся более распространенными и полезными. И затем, в конце концов, возможно, мы сможем перейти к более текстовому, диалоговому или широко открытому интерфейсу, как только мы поймем, на что способна эта технология.

Поскольку мы привыкаем к общению с нашими системами, я также в восторге от потенциала нейронных интерфейсов. Зачем говорить об этом, если я могу просто думать об этом? Я знаю, что это еще далеко, но когда я работал в Беркли, некоторые из моих коллег работали над этим. Это было бы действительно здорово. Есть много ситуаций, когда вы не хотите говорить и печатать, и это открывает новые возможности. Возможно, в будущем у нас появятся интегрированные системы, которые смогут принимать инструкции, не относящиеся к графическому интерфейсу, и преобразовывать их в действия. Мы уже видим это в некоторых из этих систем, которые могут принимать запросы и инструкции на естественном языке и преобразовывать их в действия на вашем компьютере. И дело в том, что некоторые из этих LLM также действительно хороши в генерации кода, например, второй пилот GitHub. А так, там просто большой потенциал.

Эммет: Я подозреваю, что год манипуляций с текстом в программном обеспечении будет удачным, потому что здесь так много непосредственных возможностей. Очень естественно иметь возможность выделить фрагмент текста и сказать: «Сделай это дружелюбнее». Кажется, что это место в палитре инструментов наряду с жирным шрифтом и курсивом. Это просто способ манипулирования существующим текстом. Кроме того, есть много способов продвинуться дальше, например, генерация или генерация кода.

Лично я обнаружил, что опыт работы с генераторами изображений совсем другой. Опять же, наш опыт работы с этими системами заключается в том, что мы видим прокрутку результатов, например скриншоты ChatGPT или что-то, созданное DALL-E, Midjourney или Stable Diffusion. Процесс создания генераторов изображений кажется мне неуклюжим, и что-то, что, вероятно, будет иметь графический интерфейс и гораздо более тактильный экранный интерфейс. Необходимость просто наполнить подсказку короткими F-стоп трендами в девиантном искусстве, чтобы попытаться заставить его создавать нужные вам результаты, — это явно хак. И есть много размеров разных стилей, которые вы хотите пройти, которые лучше обслуживаются ручками, циферблатами и какими-то ползунками. Я предполагаю, что мой прогноз заключается в том, что мы увидим, как быстрая инженерия в том виде, в каком она существует сегодня, будет заменена чем-то, надеюсь, намного лучшим.

«Есть что-то интересное в том, что ИИ похож на сверхмощного коллегу, который может использовать инструменты, которые у вас есть, и вы можете дать им простой текстовый отзыв, чтобы помочь им улучшить их».

И просто, чтобы закончить мысль, видео и аудио очень разные, потому что вам нужно долго сидеть и просматривать результаты. Вы можете просмотреть сотню изображений или бегло прочитать какой-нибудь текст, но, честно говоря, у меня меньше мнений по этому поводу, потому что я смог потратить на это меньше времени. Но я предполагаю, что это возвращается к тому, что вы в конечном счете сказали, Густавс. Это не удовлетворительный ответ, но он будет сильно зависеть. И я думаю, что это будет во многом зависеть от того, чем я манипулирую. И в зависимости от этого у нас могут быть очень разные пользовательские интерфейсы.

Густавс: В то же время я думаю, что будут новые интересные применения инструкций на естественном языке. Например, во время первоначального исследования нам показалось интересным то, что способ обучения ИИ может быть очень, очень похож или практически таким же, как если бы ИИ был агентом поддержки, и вы бы давали ему отзыв о своей политике в отношении как взаимодействовать с клиентами или какой тон голоса использовать. Даже когда вы даете отзывы об отдельных разговорах, вы можете просто давать их в виде обычного текста, потому что он понимает естественный язык и контекст. Думаю, мы это тоже увидим. И есть что-то интересное в том, что ИИ похож на сверхмощного коллегу, который может использовать инструменты, которые у вас есть, и вы можете дать им простой текстовый отзыв, чтобы помочь им улучшить их.

Эммет: Молли коснулась того, что происходит, когда эти штуки не просто выплевывают текст, но и могут, например, действовать. И это, вероятно, целый дополнительный уровень того, на что они способны.

Куда мы идем отсюда?

Молли: Фергал, для тех из вас, кто слушает более ранние подкасты, это директор по машинному обучению. Он говорит, что его идеалом для системы машинного обучения должен быть умный коллега, сидящий рядом с вами, которому вы можете давать инструкции, и он действительно хорошо их выполняет. Это своего рода мечта. Итак, как сказал Густавс, возможность давать обратную связь на естественном языке — это просто кардинальная перемена в том, как мы можем ею управлять.

«Как нам сделать этого умного, потенциально опасного коллегу товарищем по команде, который делает вас лучше?»

Эммет: Интересно, какой там будет диапазон. Несколько лет назад в Лондоне было агентство под названием Berg, и они провели множество экспериментов с более ранними версиями ИИ. Но одним из их принципов было «быть умным, как щенок», потому что они не хотели, чтобы ИИ казался угрожающим или подавляющим. И это был их принцип при проведении границ вокруг нас. Мне не нравится делать дизайнеров типами типа «вы не можете этого сделать», но, возможно, установление этих безопасных границ также является важной ролью для дизайнеров.

Молли: Я думаю, эти границы играют определенную роль. Я хочу работать рядом со щенком, но ты хочешь работать рядом с кем-то с интеллектом щенка? Я думаю, что роль дизайнеров заключается в следующем: как нам сделать этого умного, потенциально опасного коллегу, товарища по команде, который делает вас лучше, у которого может быть этот действительно классный сеанс мозгового штурма, где вы просто повторяете каждый другой? Как нам к этому прийти? Вот где мы действительно можем добавить эту магию — сделать рабочий день лучше, улучшить рабочие процессы и сделать ИИ настоящим товарищем по команде для людей.

Эммет: Самоуправляемые автомобили, вероятно, являются наиболее передовым приложением ИИ в настоящее время, хотя оно и не находится на уровне широкого внедрения. Напряжение этих уровней самостоятельного вождения и растущий риск по мере прохождения этих уровней — версия, которая, вероятно, применима ко многим из этих вещей, если подумать.

Молли: Да, я имею в виду, это именно то, что мы уже упоминали. Это предложение? Есть обзор? Есть одобрение? Это всего лишь наша версия пяти уровней автономных транспортных средств.

Густавс: Еще одна интересная вещь заключается в том, что со временем, когда ИИ станет лучше и сможет не только давать ответы, но и выполнять действия от вашего имени, подобно тому, как это мог бы делать ваш коллега, это станет интересной дизайнерской задачей. способ создать ощущение, что кто-то сидит рядом с вами и помогает вам, а не как хакер, взламывающий ваш компьютер и щелкающий по вещам. Если вы можете заставить это работать с дизайном, это будет волшебно. Или это может быть безумно страшно. Это будет интересная дизайнерская задача.

Эммет: И возможно, разговорный маршрут — лучший способ сделать это. Также будет интересно посмотреть, в какой степени он представлен как дружелюбный и общительный человек по сравнению с системой, с которой вы взаимодействуете на расстоянии.

«Существенно ли изменится характер производства и работа над идеями? Придется ли нам осваивать новые навыки, такие как оперативное проектирование?»

Пару лет назад у нас было то, что, оглядываясь назад, можно назвать циклом ажиотажа вокруг ботов. И на самом деле Intercom довольно активно экспериментировала и выясняла, что мы можем сделать. Конечно, у нас есть продукты, которые воспользовались этим преимуществом, как мы уже упоминали. Такие вещи, как бот разрешения и пользовательские боты. Но мы также обнаружили во время этого цикла ажиотажа, что существует целая куча приложений, которые вообще не подходят для разговорного пользовательского интерфейса. Был погодный бот, а вы такой: «На самом деле, мне не нужен бот, чтобы спрашивать, какая погода — у меня есть приложение или веб-страница, которые подходят для этого». Мы неизбежно увидим, что многое из этого произойдет и здесь. Вероятно, чрезмерное применение диалогового пользовательского интерфейса, но тогда на первый план выходят действительно полезные варианты использования.

Я добавлю еще одну вещь, которая делает меня довольно оптимистичным в разговорном вопросе, это проблема, над которой мы работали в течение длительного времени. Тест Тьюринга не нов. Но помимо этого, я работал в Google несколько лет назад. Было проделано огромное количество работы по поиску и гордости за то, что он ответил на такой вопрос, как «Какая высота Эйфелевой башни?» Что-то, что кажется супер базовым по сравнению с тем, что у нас есть сейчас. Даже такие голосовые помощники, как Siri, внезапно проснулись однажды утром в конце ноября и оказались почти устаревшими.

Скорость, с которой системы становятся лучше, также будет играть большую роль в этом. Одна из интересных и новых вещей для дизайнеров заключается в том, что мы движемся вперед в большей степени, чем мы работали с веб-технологиями или чем-то еще в прошлом. Дальнейшее развитие технологий будет диктовать не только наше режиссерское авторское видение, но и дизайнерское видение.

«Я думаю, что для дизайнеров будет очень важно опираться на это и просто играть и возиться с этими языковыми моделями и смотреть, как вы можете применить их к своему продукту».

Последнее измерение, о котором я думаю с точки зрения дизайна, в частности, это инструменты, которые мы используем, и тот факт, что они могут кардинально измениться. Сильно ли изменится характер производства и работа над идеями? Придется ли нам осваивать новые навыки, такие как оперативное проектирование? Густавс, есть какие-нибудь мысли на высоком уровне о том, что это означает для меняющейся природы фактического создания дизайна?

Густавс: Ага. В частности, с точки зрения быстрой разработки, я думаю, со временем мы увидим появление лучших практик того, как это сделать, так же, как и для любой другой технологии. И, очевидно, со временем они будут развиваться и становиться лучше, но я не думаю, что это станет ключевым отличием, которое коренным образом сформирует ваш бизнес. Сложно сказать, как изменится роль дизайнера, это зависит от временных рамок. В краткосрочной перспективе, я думаю, для дизайнеров будет очень важно опираться на это и просто играть и возиться с этими языковыми моделями и смотреть, как вы можете применить их к своему продукту, как другие компании применяют их к своим, и попытайтесь найти закономерности и интересные способы делать что-то новое.

Но в долгосрочной перспективе гораздо сложнее сказать, какое влияние это окажет на дизайнеров во всей отрасли. Так что по мере того, как ИИ становится лучше, и не только в улучшении людей, но и в полной автоматизации написания и выполнения задач, я думаю, что это может коренным образом изменить многие продукты и отрасли и даже роль дизайнеров, играющих в формировании этих продуктов. Я думаю, мы увидим. Много открытых вопросов, и будет интересно посмотреть, как это закончится.

Эммет: Ага. Одна из приятных особенностей того, чем мы занимаемся, заключается в том, что иногда технологии предоставляют вам совершенно новый вид возможностей, которыми вы можете воспользоваться. Это определенно похоже на то, что это существенно изменит ландшафт, в котором мы работаем, и создаст массу новых проблем и возможностей для дизайнеров. Для нас в Intercom очень интересно быть на этом пути и полностью приверженными ему. Без сомнения, это будет интересный год для ИИ и проектирования с использованием ИИ. Я с нетерпением жду, чтобы увидеть, где мы доберемся до этого. Может, на этом и остановимся. Молли, большое спасибо. Густавс, спасибо миллион. Было здорово пообщаться с вами и извлечь уроки из вашего предыдущего опыта работы с этой технологией. Может быть, мы сделаем это снова, когда все станем старше и мудрее, а пока большое спасибо.

Подкаст Inside Intercom (горизонтальный) (1)