IA na caixa de ferramentas do designer: moldando o futuro com o ChatGPT

Publicados: 2023-02-08

À medida que o GPT eleva a fasquia e os grandes modelos de linguagem se tornam mais sofisticados, que novos horizontes surgirão para o design thinking? E como eles irão interromper o papel tradicional dos designers de produto?

O lançamento do ChatGPT gerou um turbilhão de opiniões e discussões, com todos os tipos de pessoas envolvidas em discussões acaloradas sobre o que tudo isso significa para nós. Agora, somos os primeiros a admitir que previsões e previsões especulativas podem ser uma tarefa tola, mas uma coisa é certa – esses modelos já estão causando uma mudança sísmica na forma como pensamos e construímos nossos produtos.

Se você ouviu o Inside Intercom na semana passada, sabe que rapidamente entramos no movimento GPT, projetamos novos recursos baseados em IA e os enviamos para 160 clientes beta (sinta-se à vontade para conferir a parte um e a parte dois da conversa, se ainda não o fez). Hoje, para a última parcela de nossos bate-papos GPT, temos a companhia de algumas das pessoas que realmente têm feito trabalho de design aplicado com ChatGPT e grandes modelos de linguagem para criar produtos reais que resolvem problemas reais para os clientes.

Neste episódio, você ouvirá de nós mesmos:

  • Emmet Connolly, vice-presidente de design de produto
  • Molly Mahar, designer de produto da equipe de aprendizado de máquina
  • Gustavs Cirulis, Designer Principal de Produto Sênior

Eles falarão sobre modelos de linguagem grande (LLMs) como o ChatGPT e como eles moldarão o papel de um designer de produto nos próximos anos. Não podemos saber o que o futuro trará, mas se você nos perguntar, o melhor que pode fazer é confiar nele.

Aqui estão alguns dos principais tópicos:

  • O GPT é muito bom em resumir conteúdo, entender linguagem e editar texto. Mas um grande problema é que às vezes suas respostas parecem plausíveis, mas são factualmente incorretas.
  • À medida que a tecnologia evolui, as organizações de suporte passarão de reativas para proativas, treinando a IA e garantindo que o suporte seja feito de maneira conversacional que pareça natural para os humanos.
  • Novos padrões de design podem surgir para gerenciar incertezas e expectativas, como a construção de pontuações de confiança nos recursos.
  • Com o tempo, as empresas poderão usar modelos de código aberto e construir camadas com conhecimento especializado usando dados proprietários de seu setor ou empresa.
  • No futuro, a interação com IA pode envolver interfaces de conversação, interfaces gráficas para aumento do fluxo de trabalho e até mesmo interfaces neurais.
  • O papel de um designer será criar uma interface de IA que funcione como um colega inteligente e não ameaçador que possa aumentar seu fluxo de trabalho e facilitar seu dia.

Certifique-se de não perder nenhum destaque seguindo o Inside Intercom no Apple Podcasts, Spotify, YouTube ou acessando o feed RSS no player de sua escolha. O que se segue é uma transcrição levemente editada do episódio.


primeiros encontros

Emmet Connolly: Olá a todos. Bem-vindo ao podcast Inside Intercom. Estou muito animado hoje por ter a companhia de Molly e Gustavs da equipe de design de produtos da Intercom. Desde o lançamento do ChatGPT há algumas semanas, houve muitas discussões acaloradas, muita especulação aleatória ociosa e muitos zagueiros de poltrona sobre o que tudo isso significa. A maior parte, eu diria, é de pessoas que não trabalharam diretamente com a tecnologia, e é por isso que estou muito animado para falar com Molly e Gustavs hoje. Porque Molly e Gustavs são dois da pequena minoria de todo o mundo que realmente fizeram um trabalho real de design de produto aplicado com ChatGPT e tecnologias relacionadas. Quero dizer, realmente usá-lo para integrar produtos e resolver problemas reais de produtos para clientes com produtos reais operando em escala. Então, Molly e Gustavs, bem-vindos ao show. Talvez vocês gostariam de se apresentar brevemente. Molly, você quer ir?

Molly Mahar: Claro, claro. Eu sou Molly Mahar. Sou Staff Designer aqui na Intercom. Eu sou relativamente novo. Estou integrado à equipe de Machine Learning, com uma equipe de engenheiros, e fazemos muitos protótipos.

Gustavs Cirulis: Ei, eu sou Gustavs. Sou designer de produto principal e estou aqui há mais tempo do que Molly. Estive em vários lugares, mas no momento estou trabalhando na equipe de crescimento.

“Isso me lembrou a economia comportamental na faculdade e o efeito Dunning-Kruger, onde você é incompetente, mas confiante demais”

Emmet: Hoje vamos falar sobre IA e grandes modelos de linguagem como o ChatGPT. Especificamente, sobre o que eles significam para design e designers. Falaremos um pouco sobre as novas oportunidades disponíveis para designers, especificamente com esta nova tecnologia, como tem sido para você ou o que tem sido diferente em trabalhar com IA versus produtos tradicionais e alguns dos desafios que você encontrou ao começamos a projetar esses recursos baseados em IA. Podemos até fazer previsões imprudentes em algum momento. Mas vamos começar com o básico. Molly, qual foi sua primeira reação quando o ChatGPT entrou em cena e causou grande impacto há apenas algumas semanas? Você já trabalhou com sistemas de IA e ML por um bom tempo antes disso.

Molly: Bem, primeiro, fui bombardeado por várias capturas de tela no Slack e comecei a vê-las vindas de pessoas de toda a empresa, do Twitter e tudo mais. Eu tentei e fiquei tipo, “Isso é muito legal. Isso também é muito inteligente.” Modelos de linguagem grande (LLMs) já existem há algum tempo, mas agora eles colocaram uma interface do usuário em sua API. E assim, mais pessoas em todos os lugares podem usá-los sem precisar ser um desenvolvedor ou algo assim, o que eu acho incrível e mostra como as pessoas estavam empolgadas com eles. Comecei a brincar com ele, e é realmente poderoso.

Você pode fazer muitas perguntas, você pode acompanhar. É realmente incrível. Parece uma espécie de conversa. Então, como uma equipe, começamos a investigá-lo para tentar testá-lo. E eu senti como se estivesse começando a ver o hype. Isso me lembrou a economia comportamental na faculdade e o efeito Dunning-Kruger, onde você é incompetente, mas confiante demais. E parecia que às vezes. Este ChatGPT é muito melhor em besteiras do que eu. Estou surpreso com isso. E assim, passei por uma onda de sentimentos sobre isso. Eu me pergunto se seria útil dar uma visão geral rápida dos LLMs.

“Os LLMs já existem há algum tempo, ficando cada vez melhores e mais rápidos. O incrível do ChatGPT é que, como pessoa, posso realmente usá-lo”

Emmet: Acho que sim. Acho que, para muitas pessoas, existe essa associação com o ChatGPT como a IA de que todos estão falando. Então, você se importaria de explicar em termos leigos o que é ChatGPT e como isso se relaciona com outros termos, como grandes modelos de linguagem, sobre os quais as pessoas já devem ter ouvido falar?

Molly: Sim, farei o meu melhor. Então, grandes modelos de linguagem, LLMs, para abreviar, são modelos treinados em um enorme corpus de texto público de todos os lugares – livros, internet, fontes multimodais, eu acho, às vezes. Bilhões e bilhões e bilhões de pedaços de dados dentro. E muitas vezes são treinados com feedback humano ao longo do caminho. Acho que isso explica por que você pode ter essa conversa com o ChatGPT - você pode dar feedback, e ele realmente responderá a isso e mudará suas respostas. Os LLMs já existem há algum tempo, ficando cada vez melhores e mais rápidos. O incrível do ChatGPT é que, como pessoa, posso realmente usá-lo. E segundo, é realmente muito, muito bom. ChatGPT é basicamente o front-end, e estou simplificando um pouco, mas é o front-end para uma grande API de modelo de linguagem que o OpenAI tem em segundo plano. E eles têm vários deles.

Existem muitas outras empresas que também possuem grandes modelos de linguagem. O Google está trabalhando no LaMDA e há outras empresas. E assim, podemos dizer ChatGPT aqui hoje, mas estamos nos referindo a essa tecnologia em geral. Na verdade, estamos trabalhando com as APIs por trás dele, não com o ChatGPT, que está disponível apenas por meio da interface do usuário no momento.

“Antes, era apenas, 'Ei, me gere este poema sobre o que quer que seja'. Agora, você pode ter uma conversa de ida e volta. É assim que os humanos interagem uns com os outros”

Emmet: Sim. E acho que uma das coisas interessantes sobre o ChatGPT é que, de certa forma, não é tão novo do ponto de vista técnico. ChatGPT é um aplicativo desenvolvido usando GPT-3.5 desenvolvido por uma empresa chamada OpenAI. Mas o GPT-3.5 já existe há algum tempo – vários meses, certo, Molly? Então, estou curioso. Gustavs, qual foi a reação de vocês? Por que você acha que há uma reação diferente ao que estamos vendo com o ChatGPT em relação à tecnologia subjacente, que estava disponível há algum tempo?

Gustavs: Acho que a grande diferença é que a apresentação é como uma conversa onde você pode fazer perguntas de acompanhamento e ir mais fundo. Antes, era apenas: “Ei, me gere este poema sobre o que quer que seja”. Agora, você pode ter uma conversa de ida e volta. É assim que os humanos interagem uns com os outros. Portanto, é muito mais familiar do que fornecer um prompt único. Quando eu estava brincando com o ChatGPT quando acabou de sair, parecia mágica. Foi muito difícil acreditar que isso existe. E eu continuei brincando com isso, falando sobre diferentes tópicos, e parecia ter um tutor pessoal sob demanda que sabe tudo sobre tudo. Falava sobre todo tipo de coisa sobre tecnologia, história, psicologia e até comédia. Acontece que é muito bom criar comédia stand-up se você der uma boa dica. Foi muito divertido fazer isso também.

Um caso de alucinações

Emmet: Vocês dois passaram várias semanas trabalhando nisso agora. Todos nós tivemos uma reação inicial muito impressionante, mas depois de passar algumas semanas tentando aplicar isso a problemas reais do cliente, talvez lutando para aplicá-lo diretamente de alguma forma, isso resiste ao hype, Gustavs?

Gustavo: Sim. Assim que o ChatGPT foi lançado, ficamos realmente impressionados e percebemos que precisávamos entender melhor o que isso significa para o nosso negócio. Parecia que poderia ter um impacto realmente significativo em todo o setor de atendimento ao cliente, então formamos um pequeno grupo de trabalho e exploramos no que o ChatGPT é bom, no que é ruim e o que isso pode significar para nossos negócios. Depois de passar por esse exercício, meus próprios medos e preocupações diminuíram um pouco. Parece que a tecnologia ainda não chegou para assumir nossos trabalhos e automatizar tudo.

“A modelo quer te agradar, então ela quer te dar uma resposta que ela acha que você quer”

Acontece que é muito bom em algumas coisas, mas não em tudo. É bom, por exemplo, em coisas como resumir conteúdo ou entender linguagem e edição e escrita criativa. Mas tem uma grande falha de alucinações, onde apenas inventa coisas que parecem muito reais, mas são factualmente incorretas, o que obviamente é um grande problema para uma solução de atendimento ao cliente. Você não quer dar respostas aparentemente plausíveis, mas factualmente incorretas. Mas há muitas coisas interessantes às quais você pode aplicá-lo. E acho que a grande lição é que essa tecnologia está evoluindo muito rápido. E é realmente apenas uma questão de tempo até que ele possa fornecer respostas factualmente corretas. E quando isso acontecer, será realmente perturbador.

Emmet: Então, o que você está dizendo é que vai dar uma resposta, não importa o quê. E, em alguns casos, isso resulta no que você chama de alucinações. Molly, isso parece ser uma grande limitação para quem está tentando usar isso de verdade. O que são alucinações e por que elas estão acontecendo em primeiro lugar?

Molly: Sim, é um grande problema, como disse o Gustavs. A modelo quer te agradar, então ela quer te dar uma resposta que ela acha que você quer. Às vezes, ele tem uma fonte confiável para essas informações e, às vezes, está apenas inventando coisas. Parece uma criança. "Porque você fez isso?" "Bem, eu pensei que era isso que você queria." A alucinação pode vir de várias fontes diferentes. Se você fizer uma pergunta sobre o Intercom, ele não saberá necessariamente nada de novo. E assim, pode pegar pedaços do que sabe que são precisos, conhecimentos gerais de outros lugares, interpolar isso e, de certa forma, tentar usar o bom senso, que, claro, não tem. Realmente não tem capacidade de raciocínio. Ele usa probabilidades como: “Bem, isso provavelmente pode funcionar dessa maneira, então posso inventar uma resposta sobre algo sobre a API do Intercom” ou algo assim. E como disse o Gustavs, é super plausível. Parece muito confiante.

E como você mencionou, empresas diferentes estão se concentrando em coisas diferentes. Existem empresas que se concentram um pouco mais em como minimizar as alucinações. Considerando que o ChatGPT, eu acho, geralmente se concentra muito em proteções e ética e em ser claro sobre o que está se recusando a responder.

Emmet: Você acha que veremos uma proliferação de muitos e muitos modelos diferentes e você pode escolher aquele que melhor se adapta ao tipo de compromisso entre ser absolutamente correto e as alucinações que você deseja, ou isso é um problema que pode simplesmente desaparecem à medida que os modelos ficam mais maduros?

“O ChatGPT ilustrou algo interessante, que é que a UI e a UX de tudo isso são muito importantes”

Molly: Não tenho certeza se vai desaparecer. Mas sim, já existem muitos modelos. Existem modelos de código aberto e existe o potencial de fazer o que chamamos de ajuste fino em cima de um modelo. GPT significa transformador pré-treinado generativo, então ele gera coisas. É pré-treinado em um grande corpus e transformadores. Diferentes empresas vão se concentrar em coisas diferentes. Existem modelos de código aberto, e a Intercom, como usuário potencial desses modelos, pode ser capaz de fazer um ajuste fino para obter um conhecimento mais especializado de nosso setor ou empresa. A tecnologia também ficará melhor em usar e precisar de menos dados para ter um ótimo modelo. E assim, os modelos vão ficando cada vez menores. E potencialmente, nesse ponto, pode ser muito mais razoável para uma empresa menor criar um modelo em seus dados e torná-lo bastante especializado, bastante experiente e muito confiável.

Emmet: Vamos mudar de assunto e falar mais especificamente sobre design. Claramente, GPT e IA, em geral, têm sido principalmente uma história de tecnologia, mas acho que o ChatGPT ilustrou algo interessante, que é que a interface do usuário e a experiência do usuário de tudo isso são muito importantes. Parece haver uma mudança para UIs de conversação, potencialmente, por exemplo. Você acha que isso é verdade? Qual é o papel do design em moldar o que fazemos com esta tecnologia daqui, Molly?

Molly: Quer dizer, a Intercom está muito bem posicionada. Nosso negócio é conversação e atendimento ao cliente, e as pessoas estão ficando muito empolgadas em conversar com essa tecnologia. Mas o que descobrimos recentemente é que, pelo menos por enquanto, há tanto poder disponível na tecnologia que na verdade não é diretamente conversacional, mas trata-se de conversa e linguagem.

Como mencionamos, é ótimo para resumir e há muitos fluxos de trabalho em que o resumo pode realmente ajudar os agentes de atendimento ao cliente. Lançamos recentemente uma versão beta para alguns clientes, e o resumo é uma das coisas que as pessoas estão achando muito, muito, muito valiosas. Também adicionamos algumas ferramentas de texto generativo para permitir que os representantes façam modificações em suas mensagens se quiserem reformular as coisas, torná-las mais amigáveis, torná-las um pouco mais formais ou obter ajuda para esclarecer as coisas. Isso faz parte da conversa, mas não é conversar diretamente com o ChatGPT. Também estamos achando útil para ajudar a gerar itens como artigos da central de ajuda, que também faziam parte desta versão beta. Muito do poder disso está em alguns dos aplicativos mais ocultos que não são tão óbvios para os leigos, mas consomem muito tempo para os representantes. E podemos fornecer muito valor com isso.

“Você está procurando aquela interseção de coisas em que a tecnologia é boa e coisas em que há um risco relativamente baixo. E veremos muitos deles nos próximos meses”

Gustavo: Sim. Há muitas maneiras de usar essa tecnologia e, por meio dela, contornar alguns dos problemas que vimos, especificamente com alucinações, em que inventamos coisas que não são corretas. Mas é muito bom em outras coisas. É bom para reformular o conteúdo existente e faz sentido liderar com isso porque pode agregar valor claro. O objetivo final seria ser completamente automatizado e realmente dar respostas. Só que a tecnologia ainda não é boa o suficiente para isso. Mas acho que chegaremos lá.

Emmet: E eu suspeito que é assim que veremos as coisas ao longo de 2023, porque imagino que começaremos a ver essa invasão em muitos produtos diferentes, provavelmente de maneiras relativamente simples e infalíveis para começar e, em seguida, cada vez mais empurrando o barco para fora em termos da complexidade do que ele pode fazer. Acho que todos nós abordamos esta oportunidade com uma combinação de empolgação e talvez um pouco de ansiedade saudável também. Molly, você mencionou que temos esses recursos apoiados pelo ChatGPT em versão beta no momento. E o feedback tem sido extremamente animador e positivo. Os primeiros sinais que estamos vendo são clientes reais obtendo utilidade real de recursos como resumir uma conversa antes de entregá-la a outra pessoa. Você está procurando aquela interseção de coisas em que a tecnologia é boa e coisas em que há um risco relativamente baixo. E veremos muitos deles nos próximos meses. Então, isso vai ser emocionante.

IA conversacional

Emmet: Gustavs, você tem pensado mais sobre isso na visão de longo prazo. Você poderia falar um pouco sobre isso? Você mencionou a Intercom – uma das razões pelas quais estamos aqui falando sobre isso é que provavelmente estamos muito bem posicionados, dada a natureza de nossos produtos, que é o atendimento ao cliente conversacional, para aproveitar ao máximo isso. O que você pensa quando pensa em produtos e oportunidades de design de longo prazo?

Gustavs: Logo no início do lançamento do ChatGPT, fizemos esse workshop para tentar pensar no futuro, especificamente sobre como seria o mundo se tivéssemos um modelo que não tivesse esse problema de alucinação e fosse capaz de dar boas respostas ou dizer “não sei”. Tem sido muito promissor e realmente aumentou nossa confiança em muitas coisas em que já acreditávamos, mas que estão se acelerando. Acreditamos que a maioria das consultas de suporte será resolvida de forma totalmente automática, sem falar com humanos. Já está aumentando hoje com mais construtores do tipo “se isso, então aquilo”, com bots e nosso próprio bot de resolução, que tem alguns recursos de aprendizado de máquina, mas não na mesma medida que o ChatGPT.

“A maior parte do suporte acontecerá da maneira mais natural para os humanos, que é por meio da conversa”

Já estamos nesse caminho, mas vai se acelerar. E, como resultado disso, as organizações de suporte começarão a deixar de ser reativas e principalmente na caixa de entrada para serem proativas – configurando e treinando a IA; escrever conteúdo que a IA pode usar para resolver conversas.

Acho que a maior parte do apoio acontecerá da maneira mais natural para os humanos, que é por meio de conversas. Imagine se você tivesse alguém com quem sempre pudesse conversar e que tivesse uma resposta personalizada só para você. Essa é a maneira mais natural para os humanos interagirem. Essa experiência de busca e navegação que temos hoje, onde você busca algo no Google e escaneia para tentar encontrar respostas rapidamente em algum lugar do conteúdo, não é tão natural para os humanos. Ainda haverá algumas versões com sugestões de conteúdo que podem ser relevantes para você antes de iniciar uma conversa. Mas quando você interage com ele, ainda pode ser conversacional.

Acreditamos que também precisaremos construir uma ponte para chegar lá por vários motivos. Acho que começaremos vendo o aumento do representante de suporte com coisas como resumo ou reformulação. Posteriormente, entraremos em sugestões de respostas que os representantes de suporte podem editar e melhorar e, posteriormente, entraremos na automação total. Vai demorar um pouco, tanto para o aspecto tecnológico quanto para o humano, para se acostumar a usar cada vez mais automação.

Emmet: Você está descrevendo algo em que, em uma área de superfície muito ampla do produto, há muitos lugares diferentes onde isso pode mudar a forma como trabalhamos, tanto o que chamamos de experiência do companheiro de equipe quanto a experiência do usuário final, nos dois lados da conversa. Mas você também está descrevendo essa noção nebulosa de como chegaremos a esse futuro vago de “achamos que a tecnologia chegará lá”. Parece-me uma maneira muito diferente de pensar sobre a abordagem do design hoje e quase uma profunda diferença em como pensamos sobre a interação com computadores, indo de algo muito determinista, muito rígido – de verdadeiro e falso e uns e zeros – para algo muito mais confuso.

Novos padrões de design

Emmet: Os designers agora estão pensando em trabalhar com esse material que parece muito mais incognoscível, plástico e menos rígido do que os aplicativos CRUD, “criar, escrever, atualizar, excluir”, aos quais estamos acostumados. O que você encontrou? Existe uma diferença substancial em como os designers precisam abordar seu trabalho? Você achou certas coisas difíceis ou desafiadoras? Os designers terão que aprender novas habilidades? Quão grande é essa mudança para o ato de projetar, o fato de que o material com o qual estamos projetando quase tem esse elemento de incognoscibilidade embutido nele?

“Com o tempo, veremos cada vez mais novos padrões de design surgindo sobre como gerenciar essa incerteza e expectativas de todos os lados”

Molly: Acho que ainda há muito sobre o nosso trabalho que permanecerá o mesmo. Estamos encontrando problemas, investigando os fluxos de trabalho das pessoas, encontrando padrões. Uma grande coisa é precisar projetar para muito mais casos de falha, porque não há necessariamente guarda-corpos. Quando você está conversando, ela pode sair dos trilhos de muitas maneiras diferentes. E é o mesmo com um sistema como este. Os humanos, como espécie, não são bons em probabilidades. Quando olhamos para o boletim meteorológico e há 40% de chance de chuva, não temos uma boa noção do que isso significa.

Emmet: Sim, você fica desapontado se não chover porque lhe disseram que haveria chuva.

Molly: Sim. Estou na Holanda – quando vejo alguma chance de chuva, fico tipo: “Vai chover. É apenas uma questão de quanto tempo.” Isso é o que as porcentagens significam para mim. Mas não somos tão bons em interpretá-los. Eu acho que definitivamente vai ser algo quando olhamos para o quão confiantes essas previsões são porque são previsões de quais palavras devem vir a seguir. E vamos procurar melhorar nisso. É preciso lidar muito com a rapidez com que essa tecnologia se move e muda, e não acho que isso vá mudar. Há muita prototipagem, reação e pensamento sobre latência. A latência agora pode ser bastante longa - projetando para isso. E há muitos resultados inesperados. Essas são algumas das coisas que tenho notado.

Gustavs: Acho que, com o tempo, veremos cada vez mais novos padrões de design surgindo sobre como gerenciar essa incerteza e expectativas de todos os lados. No momento, todos estão experimentando e vendo o que funciona. Já estamos vendo alguns padrões surgindo com pequenos prompts predefinidos sobre como alterar o texto como “expandir isso”, “resumir isso”, “torná-lo mais amigável”. É um padrão relativamente novo que está começando a surgir, e acho que veremos mais e mais desses tipos de padrões. Até essa interação onde, se você pedir ao ChatGPT para gerar conteúdo, ele tem esse cursor se movendo lentamente. Esse também é um padrão de design interessante. É tecnicamente necessário, mas pode funcionar muito bem para definir expectativas de que “ei, isso é IA gerando conteúdo em tempo real”.

“Nesses novos sistemas que podem ser muito automatizados, estamos pensando em adicionar algum atrito de volta para reter as habilidades que parecem valiosas e que queremos ter?”

Emmet: Então, você está dizendo que esse efeito de digitação palavra por palavra, que é, para ser claro, uma função de como a tecnologia cria palavra por palavra, pode se tornar sinônimo e um cartão de visita visual . Talvez isso aconteça, talvez não, mas o tipo de coisa que tende a surgir quando vemos essas mudanças e o surgimento de novas tecnologias pode ser interessante para detalhar a ideia de novos padrões de design surgindo, porque vemos isso quando novas tecnologias surgem junto. Molly, existem outros que você encontrou, seja em um nível de design de interação muito baixo ou em um nível alto de como isso é costurado nos produtos?

Molly: Há algumas outras coisas que eu acho que vão começar a aparecer mais. Por exemplo, quando estamos tentando desenvolver um recurso, os engenheiros estão fazendo backtesting. Eles estão usando dados anteriores e fazendo previsões sobre isso e, em seguida, comparando-os com o que um colega de equipe realmente disse, por exemplo. Para coisas assim, talvez seja necessário iniciar o lançamento não no usuário final, mas no lado do colega de equipe ou do administrador, onde as pessoas que gerenciam uma organização CS podem querer ter o que chamo de lançamento oculto - eles não têm coisas ao vivo, mas são capaz de observá-los e ter uma sensação de: "Ok, agora confio que isso vá embora". Vários estágios de lançamentos escuros, sugestões de rascunho e diferentes estágios de lançamento de algumas dessas ferramentas. Eu acho que vai ser mais proeminente.

Não sei em que direção isso irá, mas penso nos pontos em que talvez tenhamos que adicionar atrito de volta ao sistema para não obter complacência. Os pilotos ainda fazem certas partes de um voo, embora o sistema de piloto automático faça a maior parte, porque eles precisam não esquecer como voar. Então, eles estão fazendo os pousos ou outras coisas. Nesses novos sistemas que podem ser muito automatizados, estamos pensando em adicionar algum atrito de volta para reter as habilidades que parecem valiosas e que queremos ter?

Emmet: E claramente, quase tudo tem uma pontuação de confiança implícita para o recurso embutido que você deve projetar. Isso é algo que exporíamos aos representantes e administradores ou seus clientes? Há um limite mais alto para expormos coisas a seus clientes ou até mesmo em um nível mais baixo de detalhes. Tome a capacidade de resumir uma longa conversa. Você publica esse resumo diretamente no tópico de conversa com o clique de um botão ou dá a alguém a oportunidade de revisá-lo e aprová-lo? Deixar direto em vez de adicionar um portão de aprovação? Acho que provavelmente veremos muitos fluxos de trabalho surgindo, pelo menos inicialmente, e então, eles simplesmente começam a cair à medida que a tecnologia aumenta a confiança?

Molly: Sim, exatamente.

Gustavs: Mesmo apenas a capacidade de dizer o quão confiante é. Se a IA pudesse dizer: “Ei, esta é a minha resposta e está 40% correta”, você pode apresentá-la para um ser humano aprovar antes de ser enviada. Se for 90% confiável, você pode enviar imediatamente e ter um botão "ei, isso está incorreto" no lado do usuário final. Realmente depende de como a tecnologia evolui. O design terá que evoluir junto com ele.

Emmet: Sim. Deus, conceda-me a confiança de um grande modelo de linguagem porque ele dirá com absoluta confiança uma falsidade total e a verdade total sem distinguir entre elas. E essa é a coisa da confiança. No momento, não há nada que diga: “Estou 100% confiante nesta afirmação”. No ChatGPT, pelo menos. Em alguns dos outros modelos de linguagem, acredito que estamos começando a ver fontes referenciadas, o que parece um passo positivo.

Adicionando camadas no topo

Emmet: Parece que há muitas coisas desconhecidas, muitas decisões minuciosas e profundas de design como essa para se envolver. Vamos diminuir o zoom para ver o que essas megatendências significam para design e produto. As pessoas testemunharam ou fizeram parte da chegada de grandes e novas tecnologias. Estou pensando em coisas como a nuvem ou uma mudança massiva para a web e dispositivos móveis como grandes tecnologias capacitadoras que levaram a todo esse novo mundo de padrões de design e produtos que não estavam disponíveis antes. Com a nuvem, vimos formulários, feeds, curtidas e toda a transformação visual pela qual a web passou.

Você poderia dizer muito do mesmo para dispositivos móveis – tudo, desde feeds e menus de hambúrguer até puxar para atualizar e deslizar para excluir, que agora consideramos parte do kit de ferramentas de um designer. Talvez estejamos chegando perigosamente perto do tempo de previsão, mas qual é sua experiência inicial trabalhando com isso? Isso diz alguma coisa sobre quais tipos de produtos vão ganhar ou perder e que coisas novas podemos ver surgindo que nem eram possíveis antes?

“Acho que as empresas que vão ganhar são aquelas que terão algum tipo de dados proprietários e um efeito volante coletando e melhorando continuamente esses dados”

Gustavs: Acho que, com o tempo, a maioria das empresas usará esses modelos de linguagem grandes disponíveis publicamente, em vez de criar seus próprios. Mas, para se diferenciarem, podem construir camadas sobre si com conhecimento especializado. Por exemplo, você pode ter dados específicos de negócios – para uma ferramenta de suporte, podem ser respostas a perguntas específicas sobre seu produto e seus representantes de suporte dando respostas específicas em vez de conhecimento generalizado. Pode ser um conhecimento realmente profundo de um campo específico, como o direito.

As empresas que vão ganhar, eu acho, são aquelas que terão algum tipo de dados proprietários e um efeito volante coletando e melhorando continuamente esses dados. A outra coisa que acho que será interessante é ver o que grandes players como Google, Apple e Microsoft fazem com essa tecnologia e como a integram no nível do sistema operacional. Isso pode ter um grande impacto sobre os tipos de nichos disponíveis para outras empresas.

“A OpenAI está perdendo milhões por dia para executar o ChatGPT, e provavelmente vale a pena do ponto de vista de relações públicas ou de quaisquer dados de pesquisa que eles estão obtendo, mas também significa que não será gratuito e de lazer”

Emmet: Você começou dizendo que a maioria das pessoas vai integrar esses grandes modelos de linguagem de uma certa maneira. Eu acho que as empresas que não conseguem fazer o que você estava dizendo e realmente encontram algum tipo de fosso defensivo, se encontrarão basicamente como um invólucro fino sobre o GPT que realmente não faz muito mais. Então, concordo plenamente com você aí. Se você pensar em algo como a App Store ou lojas de aplicativos móveis, havia muitos brinquedos, lanternas e coisas assim nos primeiros dias. E então, gradualmente, ele se transforma em grandes coisas como Uber, que não poderia existir se não tivéssemos esse modelo, e Instagram e mapeamento e assim por diante. Molly, algo que você gostaria de acrescentar com base em sua experiência?

Molly: Não tenho certeza absoluta de que todos usarão LLMs públicos. Eu tenho um pequeno medo de que eles sejam muito caros para muitas empresas fazerem seu modelo de negócios funcionar ou que algumas das grandes empresas possam mantê-los privados. Portanto, não tenho certeza se todos usarão os públicos ou se as pessoas se moverão mais para o código aberto e colocarão sua camada ajustada no topo. Eu concordo sobre os modos de dados. Por exemplo, na Intercom, temos muitos dados de conversação e somos capazes de fazer coisas que a Apple não pode necessariamente fazer no nível do sistema operacional. E isso nos fornece algum valor. Acho que os produtos que serão bem-sucedidos serão aqueles que, como você disse, não são apenas uma camada de mercadoria no topo, mas entendem profundamente um problema ou fluxo de trabalho e podem integrá-lo ao seu modo de dados.

Emmet: Você também tocou em algumas coisas que, por enquanto, serão importantes em relação às limitações. Está lento. Leva segundos para retornar uma resposta. Haverá alguns produtos ou espaços onde é simplesmente inadequado. Também é caro em termos de poder de computação e, portanto, caro em termos de dinheiro. Você provavelmente sabe mais do que eu sobre isso, mas cada solicitação custa alguns centavos. A OpenAI está perdendo milhões por dia para executar o ChatGPT, e provavelmente vale a pena do ponto de vista de relações públicas ou de quaisquer dados de pesquisa que eles estão obtendo, mas também significa que não será gratuito e de lazer. E embora a tecnologia tenha o hábito muito bom de ficar mais rápida e barata com o tempo, e isso potencialmente pode acontecer aqui, por enquanto, existem certas limitações que restringem o aplicativo. Talvez veremos menos em aplicativos em tempo real. Talvez o vejamos menos em aplicativos B2C, onde a escala e o custo de executar esses tipos de consultas podem ser enormes. Vai ser interessante ver como as coisas surgem lá também.

O futuro da interface

Emmet: Estou curioso para aprofundar a conversa sobre design e realmente pensar sobre esses sistemas generativos e como vamos interagir com eles. Estamos nos referindo a todos os novos toques e furtos e coisas que você pode fazer quando uma nova plataforma surge. É aqui que inevitavelmente teremos que entrar na ponta dos pés no mundo da previsão. Todos nós podemos olhar para trás daqui a um ou dois anos e rir de como estamos errados, mas há uma sensação interessante de que talvez isso esteja mudando para uma maneira de interagir mais baseada em texto, quase baseada em linha de comando. Outro tipo de microtendência no produto tem sido esse comando + K paleta que você pode abrir pressionando um atalho e digitando a ação que deseja executar. Vemos isso em muitos produtos, o que está contribuindo para essa sensação geral de mudança para texto e linguagem natural como forma direta de interface.

“Não acho que temos que escolher uma maneira de interagir com a IA. É uma capacidade muito ampla que pode ser aplicada de diferentes maneiras para diferentes casos de uso”

Por outro lado, se você observar as tendências anteriores, especialmente a jornada que percorremos a partir da interface de linha de comando, acabamos construindo interfaces gráficas de usuário muito detalhadas. E então, eu me pergunto se você gostaria de especular sobre onde você vê isso indo. Isso indica uma mudança em direção a mais interfaces de linha de comando para o século 21? Isso é uma linha de comando temporária antes de descobrirmos como é uma camada de interface gráfica do usuário nessas coisas? É muito cedo para dizer?

Gustavs: Bem, acho que teremos todos eles. Não acho que temos que escolher uma maneira de interagir com a IA. É um recurso muito amplo que pode ser aplicado de diferentes maneiras para diferentes casos de uso. Assim, por exemplo, se você está procurando uma resposta, a conversa será a principal forma de obter uma resposta. Mas se estamos falando sobre aumento do fluxo de trabalho com IA, acho que veremos interfaces gráficas com ações predefinidas para a IA realizar. É o mesmo que estamos vendo hoje com resumir, reformular e toda a onda de co-piloto para X.

Com a automação do fluxo de trabalho, quero dizer usar IA para melhorar a forma como você faz seu trabalho. Assim, por exemplo, no suporte ao cliente, é quando você escreve respostas aos clientes usando IA para melhorar essas respostas. Novamente, expandindo um ponto ou resumindo a conversa até aquele ponto. Acho que poderia haver interfaces gráficas para esses tipos de aumento do fluxo de trabalho.

Molly: Sou péssima em previsões, mas podemos ter uma espécie de proliferação de, como você disse, interfaces de comando + K ou opções diferentes do que você pode fazer. Um dos desafios dessa tecnologia é descobrir o que ela pode fazer. Você pode digitar qualquer coisa neste prompt. “Escreva-me um poema de Shakespeare como um pirata”, ou algo assim. Estaremos colocando algumas grades de proteção, mas acho que provavelmente vamos ampliar e ver as coisas se estreitando um pouco à medida que as coisas se tornam mais comuns e úteis. E então, eventualmente, talvez possamos ir para uma interface baseada em texto, conversação ou ampla, uma vez que tenhamos uma noção do que essa tecnologia pode fazer.

À medida que nos acostumamos a conversar com nossos sistemas, também fico entusiasmado com o potencial das interfaces neurais. Por que falar sobre isso se eu posso apenas pensar? Sei que está muito longe, mas quando eu estava em Berkeley, alguns de meus colegas estavam trabalhando nisso. Seria muito legal. Existem muitas situações em que você não quer falar e digitar, e isso abre as coisas. Talvez mais para frente, no futuro, teremos sistemas integrados que podem pegar instruções não-GUI e traduzi-las em ações. Já estamos vendo isso com alguns desses sistemas que podem receber consultas e instruções em linguagem natural e transformá-los em ações em seu computador. E o fato é que alguns desses LLMs também são muito bons em gerar código, como o co-piloto do GitHub. E então, há muito potencial lá.

Emmet: Suspeito que a manipulação de texto terá um ótimo ano no software porque há muitas possibilidades imediatas aqui. Parece muito natural poder destacar um trecho de texto e dizer: “torne isso mais amigável”. Quase parece que pertence à paleta de ferramentas ao lado de negrito e itálico. É apenas uma forma de manipular o texto existente. Então, existem muitas maneiras de levar isso adiante, como geração ou geração de código.

Pessoalmente, achei a experiência de trabalhar com geradores de imagens bem diferente. Mais uma vez, grande parte da nossa experiência com esses sistemas é ver os resultados rolarem, como capturas de tela do ChatGPT ou algo que DALL-E, Midjourney ou Stable Diffusion criaram. O processo de criação dos geradores de imagem parece desajeitado para mim, e algo que provavelmente será GUI-fied e terá uma interface de tela muito mais tátil. Ter que preencher o prompt com tendências curtas de F-stop na arte desviante para tentar criar as saídas que você deseja é claramente um hack. E há muitas dimensões de estilos diferentes pelos quais você deseja passar, que seriam muito mais bem atendidas por botões, mostradores e controles deslizantes de algum tipo. Acho que minha previsão é que veremos a engenharia imediata, como existe hoje, ser substituída por algo muito melhor.

“Há algo interessante sobre a IA ser como um colega superpoderoso que pode usar as ferramentas que você tem e você pode fornecer feedback em texto simples para ajudar a melhorá-las”

E só para finalizar o pensamento, vídeo e áudio são bem diferentes porque você tem que sentar muito tempo e rever os resultados. Você pode examinar centenas de imagens ou ler rapidamente algum texto, mas honestamente tenho menos opiniões sobre isso porque consegui dedicar menos tempo a isso. Mas acho que volta ao que você estava dizendo, Gustavs. Não é uma resposta satisfatória, mas vai depender muito. E acho que vai depender muito do que estou manipulando. E podemos ter interfaces de usuário muito diferentes para isso, dependendo.

Gustavs: Ao mesmo tempo, acho que haverá novas aplicações interessantes para dar instruções em linguagem natural. Por exemplo, uma coisa que achamos interessante quando fizemos nossa exploração inicial foi que a maneira como você poderia treinar IA poderia ser muito, muito semelhante ou praticamente a mesma como se a IA fosse um agente de suporte e você desse a eles feedback sobre sua política em como interagir com os clientes ou que tom de voz usar. Mesmo quando você está dando feedback sobre conversas individuais, você pode apenas dar isso em texto simples porque ele entende a linguagem natural e o contexto. Acho que veremos isso também. E há algo interessante sobre a IA ser como um colega superpoderoso que pode usar as ferramentas que você tem e você pode fornecer feedback em texto simples para ajudar a melhorá-las.

Emmet: Molly tocou no que acontece quando essas coisas não apenas cuspem texto, mas também podem realizar ações, por exemplo. E isso é provavelmente um nível adicional do que eles são capazes.

Para onde vamos daqui?

Molly: Fergal, para aqueles que ouvem alguns podcasts anteriores, é o Diretor de Machine Learning. Ele diz que seu ideal para um sistema de ML deve ser como um colega inteligente sentado ao seu lado, a quem você pode dar instruções e realmente executá-lo bem. Esse é o tipo de sonho. E assim, como disse Gustavs, ser capaz de dar feedback em linguagem natural é apenas uma mudança radical em como podemos gerenciá-lo.

“Como podemos transformar esse colega inteligente e potencialmente ameaçador em um companheiro de equipe que o está tornando melhor?”

Emmet: Eu me pergunto quanto alcance haverá. Havia uma agência chamada Berg em Londres alguns anos atrás, e eles fizeram muitos experimentos com iterações anteriores de IA. Mas um de seus princípios era “ser esperto como um cachorrinho” porque eles não queriam que a IA parecesse ameaçadora ou opressora. E esse era o princípio deles ao traçar limites ao nosso redor. Eu não gosto de esculpir designers como o tipo "você não pode fazer isso", mas talvez definir esses limites seguros seja um papel importante para os designers desempenharem também.

Molly: Acho que há um papel para esses limites. Eu quero trabalhar ao lado de um cachorrinho, mas você quer trabalhar ao lado de alguém com a inteligência de um cachorrinho? Acho que o papel dos designers é: como podemos tornar esse colega inteligente e potencialmente ameaçador, um colega de equipe que está tornando você melhor, que pode ter esse ótimo quadro branco, sessão de brainstorming em que você está apenas discutindo cada outro? Como chegamos a isso? É aí que podemos realmente adicionar essa mágica – tornando o dia de trabalho melhor, aumentando os fluxos de trabalho e tornando a IA um verdadeiro companheiro de equipe para as pessoas.

Emmet: Carros autônomos são provavelmente a aplicação mais avançada atualmente de IA, mesmo que não esteja em um nível de adoção amplo. A tensão desses níveis de direção autônoma e o risco crescente à medida que você passa por esses níveis – uma versão disso provavelmente se aplica a muitas dessas coisas, se você pensar bem.

Molly: Sim, quero dizer, isso é exatamente o que já mencionamos. É uma sugestão? Existe uma revisão? Existe aprovação? Essa é apenas a nossa versão dos cinco níveis de veículos autônomos.

Gustavs: Outra coisa interessante é que, com o tempo, à medida que a IA melhora e é capaz não apenas de dar respostas, mas também de executar ações em seu nome, semelhante a como um colega faria, será um desafio de design interessante de se imaginar descubra uma maneira de fazer com que pareça que alguém está sentado ao seu lado e ajudando você, em vez de um hacker sequestrando seu computador e clicando nas coisas. Se você conseguir fazê-lo funcionar com design, vai parecer mágico. Ou pode ser muito assustador. Vai ser um desafio de design interessante.

Emmet: E é possível que a rota da conversa seja a melhor maneira de fazer isso. O grau em que é enquadrado como uma pessoa amigável e conversadora em comparação com o sistema com o qual você interage à distância também será interessante de ver.

“A natureza da produção e o trabalho de concepção mudarão muito? Teremos que aprender novas habilidades como engenharia imediata?”

Alguns anos atrás, tínhamos o que, em retrospecto, você poderia imaginar como um ciclo de exagero de bot. E, na verdade, a Intercom estava ativamente envolvida em experimentar e descobrir o que poderíamos fazer. Claro que temos produtos que aproveitaram isso, como já mencionamos. Coisas como o Bot de resolução e Bots personalizados. Mas também descobrimos durante esse ciclo de hype que há um monte de aplicativos que não são bons para interface do usuário de conversação. Havia um bot meteorológico e você dizia: “Na verdade, não preciso de um bot para perguntar como está o tempo – tenho um aplicativo ou uma página da Web que serve para isso”. Inevitavelmente, veremos muito disso acontecer aqui também. Provavelmente uma aplicação excessiva de IU de conversação, mas os casos de uso verdadeiramente úteis vêm à tona.

Uma coisa adicional que acrescentarei que me deixa bastante otimista em relação à conversa é um problema no qual estamos trabalhando há muito tempo. O teste de Turing não é novo. Mas, além disso, trabalhei no Google há vários anos. Houve uma enorme quantidade de trabalho na pesquisa e orgulho em responder a uma pergunta como: "Qual é a altura da Torre Eiffel?" Algo que parece super básico em comparação com o que agora temos à nossa disposição. Mesmo assistentes de voz como Siri de repente acordaram em uma manhã no final de novembro para serem quase obsoletos.

A velocidade com que os sistemas melhoram realmente impulsionará uma grande parte disso também. Uma das coisas interessantes e novas para os designers é que estamos acompanhando a jornada em um grau maior do que trabalhando com tecnologias da Web ou qualquer outra coisa no passado. Para onde a tecnologia vai daqui vai ditar as coisas tanto quanto nossa visão autoral de direção como designers.

“Acho que será muito importante para os designers se dedicarem a isso e apenas brincar e mexer com esses modelos de linguagem e ver como você pode aplicá-los ao seu produto”

Uma última dimensão em que penso em termos de design, especificamente, são as ferramentas que usamos e o fato de que elas têm o potencial de mudar drasticamente. A natureza da produção e do trabalho de ideação mudará muito? Teremos que aprender novas habilidades como engenharia imediata? Gustavs, algum pensamento de alto nível sobre o que isso significa para a natureza mutável de realmente fazer design?

Gustavo: Sim. Em termos de engenharia imediata especificamente, acho que, com o tempo, veremos o surgimento de melhores práticas sobre como fazer isso da mesma forma que fizemos para qualquer outra tecnologia. E, obviamente, eles vão evoluir e melhorar com o tempo, mas não acho que será um diferencial importante que moldará fundamentalmente o seu negócio. É difícil dizer como o papel do designer vai mudar, e isso depende do prazo. A curto prazo, acho que será muito importante que os designers se debrucem sobre isso e apenas brinquem e mexam com esses modelos de linguagem e vejam como você pode aplicá-los ao seu produto, como outras empresas estão aplicando aos deles e tente encontrar padrões e formas interessantes de fazer coisas novas.

Mas, a longo prazo, é muito mais difícil dizer qual será o impacto sobre os designers de toda a indústria. Assim, à medida que a IA melhora, e não apenas no aumento de humanos, mas também na automação total da escrita e execução de tarefas, acho que isso pode atrapalhar fundamentalmente muitos produtos e indústrias e até mesmo o papel que os designers desempenham na formação desses produtos. Acho que veremos. Muitas questões em aberto, e vai ser interessante ver como isso se desenrola.

Emmet: Sim. Uma das coisas boas de fazer o que fazemos é que, ocasionalmente, a tecnologia oferece a você um novo tipo de caminho que você pode seguir. Isso definitivamente parece que vai alterar substancialmente a paisagem em que trabalhamos e criar uma tonelada de novos desafios e oportunidades para os designers. Para nós da Intercom, é muito emocionante estar bem no caminho e nesse caminho e totalmente comprometido com ele. Vai ser um ano interessante para IA e projetar com IA, sem dúvida. Estou ansioso para ver onde chegaremos a isso. Talvez possamos deixar por isso mesmo. Molly, muito obrigado. Gustavs, um milhão de agradecimentos. Foi ótimo conversar com você e aprender com sua experiência anterior trabalhando com essa tecnologia. Talvez façamos de novo quando estivermos mais velhos e mais sábios, mas por enquanto, muito obrigado.

Inside Intercom Podcast (horizontal) (1)