AI 기반 UI(일명 "채팅 반환")

게시 됨: 2023-08-11

AI 혁명은 모바일보다 크고, 클라우드보다 크며, Intercom의 일부에서는 인터넷 자체보다 더 크다고 말합니다.

많은 예측은 새로운 기능이 소프트웨어를 훨씬 더 강력하게 만드는 방법에 기반합니다. 모두 생각의 속도로. 이 모든 새로운 힘은 소프트웨어 제품을 엄청난 방식으로 변화시킬 것이며 우리는 이미 그것을 엿볼 수 있습니다. 내가 기대하는 또 다른 실질적인 변화는 제품에 대한 표준 인터페이스로서 채팅 UI(일명 자연어 인터페이스)의 등장입니다.

Neal Stephenson의 장대한 에세이/호언장담 "처음에는 명령줄이 있었다"(당연히)는 명령줄이 포인트 앤 클릭(또는 터치 및 스와이프) 인터페이스보다 더 효과적이고 효율적이라고 주장했습니다. 그러나 그렇지 않은 것은 직관적이거나 전 세계의 적은 비율 이상에서 액세스할 수 있습니다(이미지 크기를 조정하는 것이 단순한 find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; 멀리.)

명령줄은 우스꽝스러운 이름과 복잡한 구문을 가진 난해한 명령이 많이 있지만 LLM 기반 채팅은 훨씬 더 관대합니다. 사진 크기를 조정하고 싶다고 말하는 데는 12가지 방법이 있으며 LLM은 모든 방법을 이해할 것입니다.

이와 동일한 주장을 UI에 적용하면 몇 가지 유사점을 찾을 수 있습니다. 예를 들어 600억 달러 가치의 제품인 Workday가 있습니다. 나는 마지못해 로그인 방법을 기억할 수 있을 때 휴가를 요청하는 데 사용합니다. 확실히 명령줄보다 쉽지만 여전히 올바른 양식을 찾아 작성하는 일련의 단계입니다.

이제 스스로에게 물어보십시오. "결혼 기념일에 10월 14일을 원합니다"라고 입력하거나 끝없는 탭, 고스트 버튼 및 드롭다운이 있는 위의 UI를 탐색하는 것 중 무엇이 더 쉬운가요? 보너스 포인트를 위해 "des wants 10월 14일은 결혼기념일"이라고 입력하는 것보다 더 빠른 일반 UI를 디자인 수 있는지 스스로에게 물어보십시오. 쉽지 않습니다... 사실, 우리는 이미 키보드 우선 인터페이스에 대한 큰 욕구가 등장하는 것을 보았고, 그 인터페이스가 이렇게 직관적이기 이전 이었습니다. 다시 말해, Workday(최소한)에서 이러한 유형의 UI를 추가하려면 얼마나 걸릴까요?

(알았어, 들었어, 네, 몇 년이 될 수 있습니다.)

우리는 쉬운 AI 과일로 시작했습니다.

오늘날 우리는 검색 엔진, 기사 작성, 고객 지원 메신저(하이 핀!)와 같이 텍스트 상자와의 상호 작용을 이미 예상했던 영역에서 AI 챗봇이 번창하는 것을 보고 있습니다. AI에 대한 대부분의 무선 친화적 사용 사례. 디자이너로서 우리는 대부분의 작업이 하나의 둥근 사각형으로 정제된다는 사실을 받아들일 준비가 되어 있지 않을 수 있습니다.

그러나 우리는 채팅 UI가 이전에는 필수 하드코어 사용자 인터페이스, 언어 또는 명령에 의해 제한되었던 제품을 변형시키는 것을 보게 될 것입니다. 관련된 한 가지 예로 Excel에서 모든 음수 셀을 빨간색으로 강조 표시하고 싶다고 가정해 보겠습니다. 어떻게 합니까? 우리 대부분은 Google에 가서 찾고 있는 단어가 조건부 서식 이라는 것을 기억하고 "조건부 서식 Excel"을 다시 Google에 검색하면 Google 답변 상자에서 수행할 작업을 설명하므로 Excel로 돌아가서 다음을 따릅니다. 이러한 지침은 로봇 에 따라 다릅니다. 그런 다음 우리는 도중에 일시적으로 얻은 모든 지식을 즉시 기억하고 처음에 하려고 했던 작업으로 돌아갑니다.

오늘날에는 봇에게 대신 해달라고 요청할 수 있습니다. 채팅 UI는 소프트웨어에 대한 액세스의 엄청난 민주화로 이어질 수 있습니다.

복잡한 소프트웨어는 Chat UI로 개선됩니다.

대부분의 엔터프라이즈 제품 사용자는 영구적인 초보자입니다. 그들은 가장 자주 필요한 한두 가지 작업을 수행할 수 있을 만큼만 알고 있지만 그 이상은 해킹하고 스크랩하여 결과를 얻을 것입니다. 그들은 완료하고 싶은 작업에 대해 많은 생각을 가지고 있지만 방법을 모릅니다. 이 상류 장애물은 하류로 전파되고 당신이 그것을 알기도 전에 당신은 제품이 좋거나 문제를 해결할 수 있다고 생각하는 것을 포기합니다. 이미 가지고 있는 기능 때문에 경쟁사에게 고객을 빼앗긴 적이 있다면 이러한 고통을 경험한 것입니다.

Google Analytics, Salesforce 또는 제품의 강력함과 복잡성을 생각해 보십시오. " 가장 실적이 좋은 트래픽 소스는 어디에서 얻을 수 있으며 가장 최근의 새로운 소스는 무엇입니까?"와 같은 중요한 질문에 대한 정답은 저 깊은 곳에 묻혀 있습니다. , 또는 " 거래에서 어떤 경쟁업체가 증가하고 있습니까?" , 하지만 스스로 알아낼 수 있는 기회는 없습니다 . 그래서 당신은 당신의 지역 전문가에게 물어보거나 당신이 답을 만들고 아무도 알아내지 않기를 바랍니다.

아름답고 우아하더라도 UI를 배우는 것은 시간을 투자할 가치가 거의 없습니다.

그러나 하려는 일을 입력(또는 말)할 수 있고 그것이 일어나는 것을 지켜볼 수 있다면 장벽은 사라질 것입니다. 모두가 전문 지식을 습득하고 모두가 파워 유저가 되며 갑자기 제품이 게임 체인저가 됩니다. 이를 시각화하는 엄청나게 간단한 방법은 다음과 같습니다.

이 모든 제품에는 원하는 것을 알고 있지만 수행 방법을 모르는 사용자가 있습니다. 자연어 UI는 이 격차를 거의 0으로 줄입니다.

초기 릴리스 채팅 UI

우리는 이미 야생에서 이 접근 방식의 몇 가지 예를 보고 있습니다.

  • Equals: 이전 Intercomrades 2명이 구축한 Equals는 라이브 데이터에 실시간으로 연결된 차세대 스프레드시트입니다. (면책 조항/공개: 저는 투자자입니다.) 하려는 작업을 입력할 수 있으며 Equals는 사용자가 전혀 알지 못했고 스스로 해결할 수 없었던 Excel 명령을 생성합니다. .

  • Mixpanel: 이벤트 분석 회사는 최근 일반 언어로 데이터에 대한 질문을 할 수 있는 생성 AI 채팅 인터페이스인 Spark를 발표했습니다.

  • Stripe: Stripe는 고객이 자연어를 사용하여 복잡한 사기 방지 규칙을 만들 수 있는 새로운 레이더 기능을 공개했습니다.

여기에서 입력 메커니즘으로서의 채팅 UI에 초점을 맞추고 있지만 출력으로서의 채팅이 더 까다롭다는 것은 사실입니다. 많은 목적에서 시각적 우선 순위 지정, 계층 구조, 디자인, 레이아웃 등이 모두 채팅 말풍선보다 우수하기 때문입니다. 예를 들어 대시보드와 같은 항목은 본질적으로 텍스트 응답으로 대체할 수 없는 시각적 항목입니다. 그러나 UI가 상당히 흐려지는 제품이 많을 수 있습니다. 예를 들어 "Book vacation October 14th" → "Done"은 완벽하게 수용 가능한 상호 작용입니다.

나는 그것이 소프트웨어가 갈 곳이라고 믿습니다. 사람과 소프트웨어 사이의 다중 모드, 혼합 방법 통신입니다. 우리는 "포인트 앤 클릭"과 "탭 앤 스와이프"가 있었고 지금은 "입력하고 말하기"의 시대에 있습니다. 정교한 제품에 대한 액세스의 민주화는 제품과 사용자를 동등하게 변화시킬 것입니다. 결국 모든 사용자가 제품에서 모든 작업을 수행하는 방법을 알게 된다면 비즈니스는 어떻게 변할까요? 경쟁자보다 먼저 알아내는 것이 가장 좋습니다.

핀 런치 CTA 수평