Interfaccia utente basata sull'intelligenza artificiale (nota anche come "Ritorno della chat")

Pubblicato: 2023-08-11

La rivoluzione dell'intelligenza artificiale è più grande del mobile, più grande del cloud e alcuni in Intercom dicono anche più grande di Internet stesso.

Molte delle proiezioni si basano su come le nuove funzionalità renderanno il software molto più potente: la capacità di rendere le immagini dalle descrizioni, di ascoltare/leggere a lungo e riassumere in pochi secondi, di diagnosticare problemi, classificare argomenti e intraprendere azioni, tutto alla velocità del pensiero. Tutto questo nuovo potere cambierà i prodotti software in modi enormi, e ne stiamo già vedendo degli scorci. Un altro cambiamento sostanziale che mi aspetto è l'emergere dell'interfaccia utente della chat (nota anche come interfaccia in linguaggio naturale) come interfaccia standard per i prodotti.

L'epico saggio/sfogo di Neal Stephenson “In principio era la riga di comando” (giustamente) sosteneva che le righe di comando sono più efficaci ed efficienti delle interfacce punta e clicca (o tocca e scorri). Ciò che non sono, tuttavia, è intuitivo o accessibile a più di una piccola percentuale del mondo (a meno che tu non abbia intuito che ridimensionare le immagini è solo una semplice find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; via.)

La riga di comando è un gran numero di comandi arcani con nomi sciocchi e sintassi complesse, ma la chat basata su LLM è molto più indulgente. Ci sono una dozzina di modi diversi per dire che vuoi ridimensionare un'immagine e gli LLM capiranno ognuno di loro.

Se prendi lo stesso argomento per l'interfaccia utente, troverai alcune somiglianze. Ad esempio, ecco Workday, un prodotto del valore di $ 60 miliardi. Lo uso a malincuore per richiedere il tempo libero, quando riesco a ricordare come accedere. È sicuramente più facile della riga di comando, ma è comunque una serie di passaggi per trovare il modulo giusto e compilarlo.

Ora chiediti, cosa è più facile, digitando "des want 14 ott off for wedding anniversary" o navigando nell'interfaccia utente sopra con le sue infinite schede, pulsanti fantasma e menu a discesa? Per i punti bonus, chiediti se potresti mai progettare un'interfaccia utente generale che sia più veloce di me semplicemente digitando "des vuole il 14 ottobre di sconto per l'anniversario di matrimonio". Non è facile... In effetti, abbiamo già visto emergere un grande appetito per le interfacce basate su tastiera, e questo prima che fossero così intuitive. In altre parole, quanto tempo ci vorrà prima che Workday (almeno) aggiunga questo tipo di interfaccia utente?

(Va bene, ti capisco, sì, potrebbero volerci anni.)

Abbiamo iniziato con un frutto AI a bassa pendenza

Oggi vediamo che i chatbot AI prosperano in aree in cui ci aspettavamo già un'interazione con una casella di testo, ad esempio motori di ricerca, scrittura di articoli, messaggeri dell'assistenza clienti (ciao Fin!) Ma non si fermerà qui, quelli sono solo i più facili e la maggior parte dei casi d'uso compatibili con la radio per l'IA. Come designer, potremmo non essere pronti ad accettare che la maggior parte del nostro lavoro venga distillata in un rettangolo arrotondato, anche uno con una bella tipografia.

Ma vedremo l'interfaccia utente della chat trasformare prodotti precedentemente vincolati dalle loro interfacce utente, linguaggi o comandi necessariamente hardcore. Come esempio riconoscibile, supponiamo che tu sia in Excel e desideri evidenziare tutte le celle negative in rosso: come si fa? La maggior parte di noi va su Google, quindi ricorda che la parola che stiamo cercando è formattazione condizionale , quindi re-google "formattazione condizionale Excel" e quindi la casella di risposta di Google spiega cosa fare, quindi torniamo a Excel e seguiamo queste istruzioni roboticamente . Quindi memorizziamo istantaneamente tutte le conoscenze acquisite temporaneamente lungo il percorso e torniamo a tutto ciò che stavamo cercando di fare in primo luogo.

Oggi puoi semplicemente chiedere a un bot di farlo per te. L'interfaccia utente della chat può portare a un'enorme democratizzazione dell'accesso al software.

Il software complesso migliora con l'interfaccia utente della chat

La maggior parte degli utenti di prodotti aziendali sono novizi perpetui: sanno quel tanto che basta per svolgere una o due attività di cui hanno bisogno più frequentemente, ma oltre a ciò si limitano a hackerare e demolire la loro strada verso un risultato. Hanno molte nozioni sui compiti che vorrebbero completare, ma semplicemente non sanno come. Questo ostacolo a monte si propaga a valle e prima che tu te ne accorga ti arrendi semplicemente pensando che il prodotto sia buono o possa risolvere i loro problemi. Se hai mai perso un cliente a favore di un concorrente per una caratteristica che hai già, hai sperimentato questo dolore.

Pensa a Google Analytics, o Salesforce, o ai prodotti della loro potenza e complessità. Sai che sepolta in profondità da qualche parte c'è la risposta giusta a una domanda importante come " dove otteniamo le nostre fonti di traffico più performanti e qual è la nuova fonte più recente?" , o " quali concorrenti stiamo assistendo a un aumento delle trattative?" , ma non c'è alcuna possibilità che tu possa scoprirlo da solo. Quindi o chiedi al tuo esperto locale o inventi la risposta e speri che nessuno lo scopra.

Imparare l'interfaccia utente, anche se è bella ed elegante, raramente vale il tuo tempo.

Ma , se puoi semplicemente digitare (o dire) la cosa che stai cercando di fare e guardarla accadere, le barriere svaniscono. Tutti acquisiscono l'esperienza, tutti diventano utenti esperti e improvvisamente il prodotto cambia le regole del gioco. Ecco un modo ridicolmente semplice per visualizzarlo:

In tutti questi prodotti ci sono utenti che sanno cosa vogliono fare ma non sanno come farlo. L'interfaccia utente in linguaggio naturale riduce questo divario quasi a zero.

UI di chat in versione anticipata

Stiamo già vedendo alcuni esempi di questo approccio in natura.

  • Equals: creato da due ex Intercomrades, Equals è un foglio di calcolo di nuova generazione con connessioni in tempo reale a dati in tempo reale. (Dichiarazione di non responsabilità/divulgazione: sono un investitore.) Ti consente di digitare la cosa che stai cercando di fare ed Equals funzionerà e genererà i comandi di Excel che non hai mai conosciuto e che non saresti stato in grado di elaborare da solo .

  • Mixpanel: la società di analisi degli eventi ha recentemente annunciato Spark, un'interfaccia di chat AI generativa che ti consente di porre una domanda sui tuoi dati, in un linguaggio semplice.

  • Stripe: Stripe ha svelato una nuova funzionalità Radar per consentire ai clienti di utilizzare il linguaggio naturale per creare complesse regole di prevenzione delle frodi.

Mentre mi sto concentrando qui sull'interfaccia utente della chat come meccanismo di input, è vero che la chat come output è più complicata, perché per molti scopi la priorità visiva, la gerarchia, il design, il layout, ecc., sono tutti superiori a una bolla di chat. Ad esempio, cose come i dashboard sono elementi intrinsecamente visivi che non possono essere sostituiti da una risposta testuale. Tuttavia, potrebbero esserci molti prodotti che vedono la loro interfaccia utente sbiadire in modo sostanziale, ad esempio "Prenota una vacanza il 14 ottobre" → "Fatto" è un'interazione perfettamente accettabile.

Credo che sia qui che andrà il software: una comunicazione multimodale e con metodi misti tra persone e software. Abbiamo avuto "punta e clicca" e "tocca e scorri", e ora siamo nell'era del "digita e pronuncia". Questa democratizzazione dell'accesso a prodotti sofisticati trasformerà allo stesso modo i prodotti e gli utenti. Dopotutto, come cambia la tua attività se tutti i tuoi utenti ora sanno come fare tutto nel tuo prodotto? Meglio scoprirlo prima che lo faccia il tuo concorrente.

Pinna lancio CTA orizzontale