IU com tecnologia de IA (também conhecida como “Return of the Chat”)

Publicados: 2023-08-11

A revolução da IA ​​é maior que o celular, maior que a nuvem, e alguns na Intercom dizem que é ainda maior que a própria internet.

Muitas das projeções são baseadas em como os novos recursos tornarão o software muito mais poderoso: a capacidade de renderizar imagens a partir de descrições, ouvir/ler longamente e resumir em segundos, diagnosticar problemas, categorizar tópicos e executar ações, tudo na velocidade do pensamento. Todo esse novo poder mudará os produtos de software de maneiras enormes, e já estamos vendo vislumbres disso. Uma outra mudança substancial que espero é o surgimento da interface do usuário do chat (também conhecida como interface de linguagem natural) como uma interface padrão para produtos.

O épico ensaio/reclamação de Neal Stephenson “No princípio era a linha de comando” (com razão) argumentou que as linhas de comando são mais eficazes e eficientes do que as interfaces de apontar e clicar (ou tocar e deslizar). O que eles não são, no entanto, é intuitivo ou acessível para mais do que uma pequena porcentagem do mundo (a menos que você tenha adivinhado que redimensionar imagens é apenas um simples find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; ausente.)

A linha de comando é um grande número de comandos misteriosos com nomes bobos e sintaxes complexas, mas o bate-papo com LLM é muito mais indulgente. Há uma dúzia de maneiras diferentes de dizer que você deseja uma imagem redimensionada, e os LLMs entenderão cada uma delas.

Se você usar esse mesmo argumento para a interface do usuário, encontrará alguma semelhança. Por exemplo, aqui está o Workday, um produto que vale US$ 60 bilhões. Relutantemente, uso-o para solicitar uma folga, quando consigo me lembrar de como fazer o login. É mais fácil do que a linha de comando com certeza, mas ainda é uma série de etapas para encontrar o formulário certo e preenchê-lo.

Agora pergunte a si mesmo, o que é mais fácil, digitar "des quer folga em 14 de outubro para o aniversário de casamento" ou navegar na interface do usuário acima com suas guias infinitas, botões fantasmas e menus suspensos? Para obter pontos de bônus, pergunte a si mesmo se você poderia projetar uma interface do usuário geral que seria mais rápida do que eu apenas digitando “des quer 14 de outubro de folga para o aniversário de casamento”. Não é fácil… Na verdade, já vimos surgir um grande apetite por interfaces que priorizam o teclado, e isso foi antes de serem tão intuitivas. Em outras palavras, quanto tempo antes do Workday (pelo menos) adicionar esse tipo de interface do usuário?

(Ok, eu ouvi você, sim, pode levar anos.)

Começamos com frutas de IA fáceis de pendurar

Hoje estamos vendo chatbots AI prosperar em áreas onde já esperávamos uma interação com uma caixa de texto, por exemplo, motores de busca, redação de artigos, mensageiros de suporte ao cliente (oi Fin!) Mas não vai parar por aí, esses são apenas os mais fáceis e a maioria dos casos de uso compatíveis com rádio para IA. Como designers, podemos não estar prontos para aceitar que a maior parte do nosso trabalho seja destilada em um retângulo arredondado, mesmo com uma tipografia bonita.

Mas veremos a IU de bate-papo transformar produtos anteriormente limitados por suas interfaces de usuário, idiomas ou comandos necessariamente hardcore. Como um exemplo relacionável, digamos que você esteja no Excel e queira destacar todas as células negativas em vermelho – como você faz isso? A maioria de nós vai ao Google, então lembra que a palavra que estamos procurando é formatação condicional e, em seguida, pesquisamos novamente no Google “formatação condicional do Excel” e, em seguida, a caixa de resposta do Google explica o que fazer, então voltamos ao Excel e seguimos essas instruções roboticamente . Então, instantaneamente, guardamos na memória todo o conhecimento adquirido temporariamente ao longo do caminho e voltamos ao que quer que estivéssemos tentando fazer em primeiro lugar.

Hoje, você pode simplesmente pedir a um bot para fazer isso por você. A interface do usuário do bate-papo pode levar a uma enorme democratização do acesso ao software.

Software complexo fica melhor com chat UI

A maioria dos usuários de produtos corporativos são novatos perpétuos – eles sabem apenas o suficiente para realizar uma ou duas tarefas que exigem com mais frequência, mas, além disso, eles simplesmente abrem caminho para um resultado. Eles têm muitas noções sobre as tarefas que adorariam realizar, mas simplesmente não sabem como. Esse obstáculo upstream se propaga downstream e antes que você perceba, você simplesmente desiste de pensar que o produto é bom ou pode resolver seus problemas. Se você já perdeu um cliente para um concorrente por causa de um recurso que já possui, já experimentou essa dor.

Pense no Google Analytics, ou Salesforce, ou produtos de seu poder e complexidade. Você sabe que enterrada lá no fundo em algum lugar está a resposta certa para uma pergunta importante como " onde obtemos nossas fontes de tráfego de melhor desempenho e qual é a nova fonte mais recente?" , ou “ que concorrentes estamos vendo aumentar nos negócios?” , mas não há chance de você descobrir por conta própria. Então, você pergunta ao seu especialista local ou inventa a resposta e espera que ninguém descubra.

Aprender a interface do usuário, mesmo que seja bonita e elegante, raramente vale o seu tempo.

Mas , se você puder apenas digitar (ou dizer) o que está tentando fazer e observar isso acontecer, as barreiras desaparecerão. Todos adquirem o conhecimento, todos se tornam usuários avançados e, de repente, o produto é um divisor de águas. Aqui está uma maneira ridiculamente simples de visualizá-lo:

Em todos esses produtos, há usuários que sabem o que querem fazer, mas não sabem como fazer. A IU de linguagem natural reduz essa lacuna para quase zero.

IUs de chat de lançamento antecipado

Já estamos vendo alguns exemplos dessa abordagem na natureza.

  • Equals: Construído por dois ex-Intercomrades, Equals é uma planilha de última geração com conexões ao vivo para dados ao vivo. (Isenção de responsabilidade / divulgação: sou um investidor.) Ele permite que você digite o que está tentando fazer e o Equals funcionará e gerará os comandos do Excel que você nunca conheceu e não seria capaz de resolver sozinho .

  • Mixpanel: A empresa de análise de eventos anunciou recentemente o Spark, uma interface de bate-papo de IA generativa que permite que você faça perguntas sobre seus dados, em linguagem simples.

  • Stripe: A Stripe revelou um novo recurso de radar para permitir que os clientes usem linguagem natural para criar regras complexas de prevenção de fraudes.

Embora eu esteja me concentrando aqui na interface do usuário do chat como um mecanismo de entrada, é verdade que o chat como saída é mais complicado porque, para muitos propósitos, a priorização visual, a hierarquia, o design, o layout etc. são superiores a um balão de chat. Por exemplo, itens como painéis são itens inerentemente visuais que não podem ser substituídos por uma resposta de texto. No entanto, pode haver muitos produtos cuja interface do usuário desapareça substancialmente – por exemplo, “Reservar férias para 14 de outubro” → “Concluído” é uma interação perfeitamente aceitável.

Acredito que é para onde o software está indo – uma comunicação multimodal e de método misto entre pessoas e software. Já tivemos “apontar e clicar” e “tocar e deslizar” e agora estamos na era do “digitar e dizer”. Essa democratização do acesso a produtos sofisticados transformará igualmente os produtos e os usuários. Afinal, como o seu negócio muda se todos os seus usuários agora sabem fazer tudo no seu produto? Melhor descobrir antes que seu concorrente o faça.

Fin lançamento CTA horizontal