Пользовательский интерфейс на основе искусственного интеллекта (также известный как «Возвращение чата»)
Опубликовано: 2023-08-11Революция ИИ больше, чем мобильные устройства, больше, чем облака, а некоторые в Intercom говорят, что даже больше, чем сам Интернет.
Многие прогнозы основаны на том, как новые возможности сделают программное обеспечение намного более мощным: способность отображать изображения из описаний, долго слушать/читать и подводить итоги за секунды, диагностировать проблемы, классифицировать темы и предпринимать действия, все со скоростью мысли. Вся эта новая мощь сильно изменит программные продукты, и мы уже видим проблески этого. Еще одним существенным изменением, которое я ожидаю, является появление пользовательского интерфейса чата (также известного как интерфейс на естественном языке) в качестве стандартного интерфейса для продуктов.
В эпическом эссе/разглагольствовании Нила Стефенсона «Вначале была командная строка» (правильно) утверждалось, что командные строки более эффективны и действенны, чем интерфейсы типа «укажи и щелкни» (или коснись и проведи пальцем). Однако то, чем они не являются, является интуитивно понятным или доступным более чем небольшому проценту людей в мире (если только вы не догадались, что изменение размера изображений — это всего лишь простая find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \;
прочь.)
Командная строка представляет собой большое количество загадочных команд с глупыми именами и сложным синтаксисом, но чат на основе LLM гораздо более щадящий. Есть дюжина разных способов сказать, что вы хотите изменить размер изображения, и LLM поймут каждый из них.
Если применить тот же аргумент к пользовательскому интерфейсу, вы обнаружите некоторое сходство. Например, вот Workday, продукт стоимостью 60 миллиардов долларов. Я неохотно использую его, чтобы запросить отпуск, когда я могу вспомнить, как войти в систему. Это, безусловно, проще, чем командная строка, но все же это ряд шагов, чтобы найти нужную форму и заполнить ее.
А теперь спросите себя, что проще: напечатать «дес хочет 14 октября на годовщину свадьбы» или перемещаться по приведенному выше пользовательскому интерфейсу с его бесконечными вкладками, кнопками-призраками и раскрывающимися списками? Чтобы получить бонусные баллы, спросите себя, сможете ли вы когда-нибудь разработать общий пользовательский интерфейс, который будет работать быстрее, чем я, просто набирающий «дес хочет 14 октября на годовщину свадьбы». Это непросто… На самом деле, мы уже видели большой спрос на интерфейсы с клавиатурой, и это было до того, как они стали такими интуитивно понятными. Иными словами, как скоро Workday (по крайней мере) добавит этот тип пользовательского интерфейса?
(Хорошо, я слышу вас, да, это могут быть годы.)
Мы начали с низко висящих плодов ИИ
Сегодня мы видим, как чат-боты с искусственным интеллектом процветают в областях, где мы уже ожидали взаимодействия с текстовым полем, например, в поисковых системах, написании статей, мессенджерах службы поддержки (привет, Фин!). наиболее удобные для радио варианты использования ИИ. Как дизайнеры, мы, возможно, не готовы смириться с тем, что большая часть нашей работы будет сводиться к одному прямоугольнику со скругленными углами, даже с красивой типографикой.
Но мы увидим, как пользовательский интерфейс чата трансформирует продукты, ранее ограниченные их обязательно жесткими пользовательскими интерфейсами, языками или командами. В качестве одного из примеров, скажем, вы работаете в Excel и хотите выделить все отрицательные ячейки красным цветом — как вы это делаете? Большинство из нас заходит в Google, затем вспоминает, что слово, которое мы ищем, это условное форматирование , а затем мы повторно гуглим «условное форматирование Excel», а затем в окне ответа Google объясняется, что делать, поэтому мы возвращаемся в Excel и следуем эти инструкции автоматически . Затем мы мгновенно запоминаем все временно полученные знания и возвращаемся к тому, что пытались сделать в первую очередь.
Сегодня вы можете просто попросить бота сделать это за вас. Пользовательский интерфейс чата может привести к огромной демократизации доступа к программному обеспечению.

Сложное программное обеспечение становится лучше благодаря пользовательскому интерфейсу чата
Большинство пользователей корпоративных продуктов являются вечными новичками: они знают ровно столько, сколько нужно для выполнения одной или двух задач, которые им чаще всего требуются, но помимо этого они будут просто ломать и ломать свой путь к результату. У них много представлений о задачах, которые они хотели бы выполнить, но они просто не знают, как это сделать. Это восходящее препятствие распространяется вниз по течению, и, прежде чем вы это узнаете, вы просто перестанете думать, что продукт хорош или может решить их проблемы. Если вы когда-либо теряли клиента из-за функции, которая у вас уже есть, вы испытали эту боль.
Подумайте о Google Analytics, Salesforce или других продуктах с их мощью и сложностью. Вы знаете, что где-то глубоко внутри спрятан правильный ответ на важный вопрос, например: « Где мы берем наши самые эффективные источники трафика и какой самый последний новый источник?» или « у каких конкурентов мы наблюдаем увеличение количества сделок?» , но нет никаких шансов, что ты сможешь узнать это самостоятельно. Поэтому вы либо спрашиваете своего местного эксперта, либо придумываете ответ и надеетесь, что никто не узнает.
Изучение пользовательского интерфейса, даже если он красивый и элегантный, редко стоит вашего времени.
Но если вы можете просто напечатать (или сказать) то, что пытаетесь сделать, и посмотреть, как это происходит, барьеры исчезнут. Все приобретают опыт, все становятся опытными пользователями, и внезапно продукт меняет правила игры. Вот один смехотворно простой способ визуализировать это:
Во всех этих продуктах есть пользователи, которые знают, что они хотят делать, но не знают, как это сделать. Пользовательский интерфейс на естественном языке сокращает этот разрыв практически до нуля.
Пользовательский интерфейс чата раннего выпуска
Мы уже видим некоторые примеры этого подхода в дикой природе.
- Equals: Созданная двумя бывшими Intercomrades, Equals представляет собой электронную таблицу нового поколения с живым подключением к оперативным данным. (Отказ от ответственности/раскрытие информации: я инвестор.) Это позволяет вам вводить то, что вы пытаетесь сделать, а Equals будет работать и генерировать команды Excel, которые вы никогда не знали и не могли работать самостоятельно. .
- Mixpanel: компания, занимающаяся аналитикой событий, недавно анонсировала Spark, генеративный интерфейс чата с искусственным интеллектом, который позволяет вам задать вопрос о ваших данных простым языком.
- Stripe: Stripe представила новую функцию Radar, которая позволяет клиентам использовать естественный язык для создания сложных правил предотвращения мошенничества.
Хотя я сосредоточился здесь на пользовательском интерфейсе чата как на механизме ввода, правда, чат как вывод сложнее, потому что для многих целей визуальная расстановка приоритетов, иерархия, дизайн, макет и т. д. превосходят всплывающее окно чата. Например, такие вещи, как информационные панели, по своей сути являются визуальными элементами, которые нельзя заменить текстовым ответом. Тем не менее, может быть много продуктов, пользовательский интерфейс которых существенно увядает — например, «Забронировать отпуск 14 октября» → «Готово» — это вполне приемлемое взаимодействие.
Я считаю, что именно к этому и придет программное обеспечение — к мультимодальной, смешанной коммуникации между людьми и программным обеспечением. У нас были «наведи и щелкни» и «нажми и проведи», и теперь мы живем в эпоху «напечатай и скажи». Эта демократизация доступа к сложным продуктам в равной степени изменит продукты и пользователей. В конце концов, как изменится ваш бизнес, если все ваши пользователи теперь знают, как все делать в вашем продукте? Лучше выяснить это до того, как это сделает ваш конкурент.