Interfejs użytkownika oparty na sztucznej inteligencji (znany również jako „Powrót czatu”)

Opublikowany: 2023-08-11

Rewolucja AI jest większa niż mobilna, większa niż chmura, a niektórzy w Intercom twierdzą, że nawet większa niż sam Internet.

Wiele przewidywań opiera się na tym, jak nowe możliwości zwiększą możliwości oprogramowania: możliwość renderowania obrazów z opisów, długiego słuchania/czytania i streszczania w kilka sekund, diagnozowania problemów, kategoryzowania tematów i podejmowania działań, wszystko w tempie myśli. Cała ta nowa moc zmieni oprogramowanie w ogromny sposób i już widzimy przebłyski tego. Inną istotną zmianą, której się spodziewam, jest pojawienie się Chat UI (znanego również jako interfejs języka naturalnego) jako standardowego interfejsu produktów.

Epicki esej / tyrada Neala Stephensona „Na początku była linia poleceń” (słusznie) dowodzi, że linie poleceń są bardziej skuteczne i wydajne niż interfejsy typu wskaż i kliknij (lub dotknij i przesuń). To, czym nie są, jest jednak intuicyjne lub dostępne dla więcej niż niewielkiego procenta świata (chyba że zgadłbyś, że zmiana rozmiaru obrazów to tylko proste find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; dalej.)

Wiersz poleceń to duża liczba tajemniczych poleceń z głupimi nazwami i złożoną składnią, ale czat obsługiwany przez LLM jest o wiele bardziej wyrozumiały. Istnieje tuzin różnych sposobów, aby powiedzieć, że chcesz zmienić rozmiar obrazu, a LLM zrozumieją każdy z nich.

Jeśli weźmiesz ten sam argument do interfejsu użytkownika, znajdziesz pewne podobieństwo. Na przykład, tutaj jest Workday, produkt wart 60 miliardów dolarów. Niechętnie używam go, aby poprosić o czas wolny, kiedy pamiętam, jak się zalogować. Z pewnością jest to łatwiejsze niż wiersz poleceń, ale znalezienie odpowiedniego formularza i wypełnienie go to wciąż szereg kroków.

Teraz zadaj sobie pytanie, co jest łatwiejsze, wpisując „des chce 14 października wolny na rocznicę ślubu” czy nawigować po powyższym interfejsie z niekończącymi się kartami, przyciskami duchów i listami rozwijanymi? Aby uzyskać dodatkowe punkty, zadaj sobie pytanie, czy kiedykolwiek mógłbyś zaprojektować ogólny interfejs użytkownika, który byłby szybszy niż wpisanie „des chce 14 października wolnego na rocznicę ślubu”. To nie jest łatwe… W rzeczywistości widzieliśmy już duży apetyt na interfejsy oparte na klawiaturze, i to było zanim stały się tak intuicyjne. Innymi słowy, ile czasu minie, zanim Workday (przynajmniej) doda ten typ interfejsu użytkownika?

(Dobra, słyszę cię, tak, to mogą być lata.)

Zaczęliśmy od nisko wiszących owoców AI

Dzisiaj widzimy, jak chatboty AI prosperują w obszarach, w których już spodziewaliśmy się interakcji z polem tekstowym, np. w wyszukiwarkach, pisaniu artykułów, komunikatorach obsługi klienta (cześć Fin!). Ale to nie koniec, to tylko najłatwiejsze i najbardziej przyjazne dla radia przypadki użycia AI. Jako projektanci możemy nie być gotowi zaakceptować faktu, że większość naszej pracy zostanie sprowadzona do jednego zaokrąglonego prostokąta, nawet takiego z ładną typografią.

Ale zobaczymy, jak interfejs użytkownika czatu przekształca produkty, które wcześniej były ograniczone przez ich koniecznie hardkorowe interfejsy użytkownika, języki lub polecenia. Jako jeden relatywny przykład, załóżmy, że jesteś w programie Excel i chcesz podświetlić wszystkie negatywne komórki na czerwono — jak to zrobić? Większość z nas wchodzi do Google, a potem przypomina sobie, że słowo, którego szukamy, to formatowanie warunkowe , a następnie ponownie wygooglujemy „formatowanie warunkowe Excel”, a następnie pole odpowiedzi Google wyjaśnia, co robić, więc wracamy do Excela i podążamy za te instrukcje zrobotyzowane . Następnie natychmiast zapamiętujemy całą wiedzę, którą tymczasowo zdobyliśmy po drodze i wracamy do tego, co próbowaliśmy zrobić w pierwszej kolejności.

Dzisiaj możesz po prostu poprosić bota, aby zrobił to za Ciebie. Chat UI może doprowadzić do ogromnej demokratyzacji dostępu do oprogramowania.

Złożone oprogramowanie staje się lepsze dzięki interfejsowi czatu

Większość użytkowników produktów dla przedsiębiorstw to wieczni nowicjusze — wiedzą wystarczająco dużo, aby wykonać jedno lub dwa zadania, których najczęściej wymagają, ale poza tym po prostu siekają i złomują, aby osiągnąć wynik. Mają wiele pomysłów na zadania, które chcieliby wykonać, ale po prostu nie wiedzą, jak to zrobić. Ta przeszkoda w górnym biegu rozprzestrzenia się w dół i zanim się zorientujesz, po prostu rezygnujesz z myślenia, że ​​produkt jest dobry lub może rozwiązać ich problemy. Jeśli kiedykolwiek straciłeś klienta na rzecz konkurencji z powodu funkcji, którą już posiadasz, doświadczyłeś tego bólu.

Pomyśl o Google Analytics, Salesforce lub produktach o ich mocy i złożoności. Wiesz, że głęboko zakopane gdzieś tam jest właściwą odpowiedzią na ważne pytanie, takie jak „ skąd czerpiemy nasze najskuteczniejsze źródła ruchu i jakie jest najnowsze nowe źródło?” lub „ jakim konkurentom obserwujemy wzrost liczby transakcji?” , ale nie ma szans, żebyś sam się o tym przekonał. Więc albo pytasz lokalnego eksperta, albo wymyślasz odpowiedź i masz nadzieję, że nikt się nie dowie.

Nauka interfejsu użytkownika, nawet jeśli jest piękny i elegancki, rzadko jest warta twojego czasu.

Ale jeśli możesz po prostu wpisać (lub powiedzieć) rzecz, którą próbujesz zrobić i obserwować, jak to się dzieje, bariery znikają. Każdy nabywa wiedzę, każdy staje się zaawansowanym użytkownikiem i nagle produkt zmienia zasady gry. Oto jeden śmiesznie prosty sposób, aby to zwizualizować:

We wszystkich tych produktach są użytkownicy, którzy wiedzą, co chcą robić, ale nie wiedzą, jak to zrobić. Interfejs użytkownika języka naturalnego zmniejsza tę lukę prawie do zera.

Wczesne wersje interfejsów czatu

Widzimy już kilka przykładów tego podejścia na wolności.

  • Equals: Stworzony przez dwóch byłych Intercomrades, Equals to arkusz kalkulacyjny nowej generacji z połączeniami na żywo z danymi na żywo. (Zastrzeżenie/ujawnienie: jestem inwestorem.) Pozwala ci wpisać rzecz, którą próbujesz zrobić, a Equals opracuje i wygeneruje polecenia Excela, których nigdy nie znałeś i nie będziesz w stanie samodzielnie wypracować .

  • Mixpanel: firma zajmująca się analizą wydarzeń niedawno ogłosiła Spark, generatywny interfejs czatu AI, który pozwala zadawać proste pytania dotyczące danych.

  • Stripe: Stripe zaprezentował nową funkcję Radar, która pozwala klientom używać języka naturalnego do tworzenia złożonych reguł zapobiegania oszustwom.

Chociaż skupiam się tutaj na interfejsie czatu jako mechanizmie wejściowym, prawdą jest, że czat jako wynik jest trudniejszy, ponieważ w wielu przypadkach priorytetyzacja wizualna, hierarchia, projekt, układ itp. są lepsze niż bańka czatu. Na przykład elementy takie jak pulpity nawigacyjne są z natury elementami wizualnymi, których nie można zastąpić odpowiedzią tekstową. Jednak w przypadku wielu produktów interfejs użytkownika może znacznie zanikać — na przykład „Zarezerwuj wakacje 14 października” → „Gotowe” to całkowicie akceptowalna interakcja.

Wierzę, że właśnie tam zmierza oprogramowanie – multimodalna, mieszana metoda komunikacji między ludźmi a oprogramowaniem. Mieliśmy „wskaż i kliknij” oraz „dotknij i przesuń”, a teraz jesteśmy w erze „wpisz i powiedz”. Demokratyzacja dostępu do zaawansowanych produktów przekształci zarówno produkty, jak i użytkowników. W końcu, jak zmieni się Twoja firma, jeśli wszyscy Twoi użytkownicy wiedzą teraz, jak zrobić wszystko w Twoim produkcie? Najlepiej dowiedzieć się, zanim zrobi to konkurencja.

Płetwa uruchamia CTA poziomo