IA en la caja de herramientas del diseñador: Dando forma al futuro con ChatGPT

Publicado: 2023-02-08

A medida que GPT sube el listón y los modelos de lenguajes extensos se vuelven más sofisticados, ¿qué nuevos horizontes surgirán para el pensamiento de diseño? ¿Y cómo alterarán el papel tradicional de los diseñadores de productos?

El lanzamiento de ChatGPT ha provocado un torbellino de opiniones y debates, con todo tipo de personas participando en intercambios acalorados sobre lo que significa todo esto para nosotros. Ahora, somos los primeros en admitir que las predicciones y los pronósticos especulativos pueden ser una tontería, pero una cosa es segura: estos modelos ya están causando un cambio sísmico en la forma en que pensamos y construimos nuestros productos.

Si ha estado escuchando Inside Intercom la semana pasada, sabe que rápidamente nos subimos al tren de GPT, diseñamos nuevas funciones impulsadas por IA y las enviamos a 160 clientes beta (no dude en consultar la primera parte y la parte dos de la conversación si aún no lo has hecho). Hoy, para la última entrega de nuestros chats de GPT, nos acompañan algunas de las personas que han estado haciendo trabajo de diseño aplicado con ChatGPT y modelos de lenguaje extenso para crear productos reales que resuelven problemas reales para los clientes.

En este episodio, escuchará de los nuestros:

  • Emmet Connolly, vicepresidente de diseño de productos
  • Molly Mahar, diseñadora de productos del personal del equipo de aprendizaje automático
  • Gustavs Cirulis, diseñador principal de productos sénior

Hablarán sobre modelos de lenguaje extenso (LLM, por sus siglas en inglés) como ChatGPT y cómo darán forma al rol de un diseñador de productos en los años venideros. No podemos saber qué traerá el futuro, pero si nos preguntas, lo mejor que puedes hacer es apoyarte en él.

Estos son algunos de los puntos clave:

  • GPT es realmente bueno para resumir contenido, comprender el lenguaje y editar texto. Pero un problema importante es que a veces sus respuestas suenan plausibles, pero en realidad son incorrectas.
  • A medida que la tecnología evolucione, las organizaciones de soporte pasarán de ser reactivas a proactivas al entrenar la IA y garantizar que el soporte se realice de una manera conversacional que se sienta natural para los humanos.
  • Pueden surgir nuevos patrones de diseño para gestionar la incertidumbre y las expectativas, como la creación de puntuaciones de confianza en las características.
  • Con el tiempo, las empresas podrán utilizar modelos de código abierto y crear capas superiores con conocimientos especializados utilizando datos patentados de su industria o empresa.
  • En el futuro, la interacción con la IA puede implicar interfaces conversacionales, interfaces gráficas para aumentar el flujo de trabajo e incluso interfaces neuronales.
  • El papel de un diseñador será crear una interfaz de IA que funcione como un colega inteligente y no amenazador que pueda aumentar su flujo de trabajo y facilitarle el día.

Asegúrese de no perderse ningún momento destacado siguiendo a Inside Intercom en Apple Podcasts, Spotify, YouTube o accediendo a la fuente RSS en el reproductor de su elección. Lo que sigue es una transcripción ligeramente editada del episodio.


primeros encuentros

Emmet Connolly: Hola a todos. Bienvenido al podcast de Inside Intercom. Estoy muy emocionado hoy de que me acompañen Molly y Gustavs del equipo de diseño de productos de intercomunicación. Desde el lanzamiento de ChatGPT hace unas semanas, ha habido muchas discusiones acaloradas, muchas especulaciones aleatorias ociosas y muchos comentarios de sillón sobre lo que significa todo esto. Diría que la mayor parte proviene de personas que en realidad no han trabajado directamente con la tecnología, por lo que estoy muy emocionado de hablar con Molly y Gustavs hoy. Porque Molly y Gustavs son dos de la minoría bastante diminuta de todo el mundo que realmente han realizado un trabajo real de diseño de productos aplicados con ChatGPT y tecnologías relacionadas. Quiero decir, usarlo para integrarse con productos y resolver problemas reales de productos para clientes con productos reales que operan a escala. Entonces, Molly y Gustavs, bienvenidos al espectáculo. Tal vez les gustaría presentarse muy brevemente. Molly, ¿quieres ir?

Molly Mahar: Claro, claro. Soy Molly Mahar. Soy un diseñador de personal aquí en Intercom. soy bastante nuevo Estoy integrado con el equipo de Machine Learning, con un equipo de ingenieros, y hacemos muchos prototipos.

Gustavs Cirulis: Hola, soy Gustavs. Soy diseñadora principal de productos y llevo aquí un poco más que Molly. He estado por todos lados, pero por el momento, estoy trabajando en el equipo de crecimiento.

“Me recordó la economía del comportamiento en la universidad y el efecto Dunning-Kruger, donde eres incompetente pero demasiado confiado”

Emmet: Hoy vamos a hablar sobre IA y modelos de lenguaje extenso como ChatGPT. En concreto, sobre lo que suponen para el diseño y los diseñadores. Hablaremos un poco sobre las nuevas oportunidades que están disponibles para los diseñadores, específicamente con esta nueva tecnología, cómo ha sido para usted o qué ha sido diferente al trabajar con IA en comparación con los productos tradicionales, y algunos de los desafíos que ha encontrado mientras trabajaba. He comenzado a diseñar estas características impulsadas por IA. Incluso podríamos entrar en alguna predicción desacertada en algún momento. Pero empecemos por lo básico. Molly, ¿cuál fue tu primera reacción cuando ChatGPT apareció en escena y causó un gran revuelo hace solo unas semanas? Has estado trabajando con sistemas AI y ML durante bastante tiempo antes de eso.

Molly: Bueno, primero, me bombardearon con una serie de capturas de pantalla en Slack y comencé a verlas de personas de toda la empresa y en Twitter y todo. Lo probé y dije: “Esto es genial. Esto también es muy inteligente”. Los modelos de lenguaje grande (LLM) han existido por un tiempo, pero ahora han puesto una interfaz de usuario en su API. Y así, más personas en todas partes pueden usarlos sin tener que ser un desarrollador ni nada, lo que creo que es bastante asombroso y muestra cuán emocionada estaba la gente con ellos. Empecé a jugar con él, y es realmente poderoso.

Puedes hacerle muchas preguntas, puedes hacer un seguimiento. Se siente realmente increíble. Se siente como una especie de conversación. Luego comenzamos, como equipo, a profundizar en él para intentar ponerlo a prueba. Y sentí que estaba empezando a ver el bombo. Me recordó la economía del comportamiento en la universidad y el efecto Dunning-Kruger, donde eres incompetente pero demasiado confiado. Y se sentía así a veces. Este ChatGPT es mucho mejor bromeando que yo. Estoy asombrado. Y así, pasé por una ola de sentimientos al respecto. Me pregunto si sería útil dar una descripción general rápida de los LLM.

“Los LLM han existido por un tiempo, mejorando cada vez más y más rápido. Lo sorprendente de ChatGPT es que, como persona, puedo usarlo”

Emmet: Creo que sí. Creo que, para mucha gente, existe esta asociación con ChatGPT como la IA de la que todo el mundo habla. Entonces, ¿le importaría explicar en términos sencillos qué es ChatGPT y cómo se relaciona con otros términos como modelos de lenguaje extenso de los que la gente podría haber oído hablar?

Molly: Sí, haré lo mejor que pueda. Entonces, los modelos de lenguaje grande, LLM, para abreviar, son modelos entrenados en un gran corpus de texto público de todas partes: libros, Internet, fuentes multimodales, creo, a veces. Miles de millones y miles de millones y miles de millones de piezas de datos dentro. Y a menudo son entrenados con retroalimentación humana en el camino. Creo que eso explica por qué puede tener esta conversación con ChatGPT: puede enviarle comentarios y, de hecho, responderá a eso y cambiará sus respuestas. Los LLM han existido por un tiempo, mejorando y acelerando cada vez más. Lo sorprendente de ChatGPT es que, como persona, puedo usarlo. Y segundo, es realmente muy, muy bueno. ChatGPT es la interfaz, básicamente, y lo estoy simplificando un poco, pero es la interfaz para una API de modelo de lenguaje grande que OpenAI tiene en segundo plano. Y tienen varios de estos.

Hay muchas otras empresas que también tienen grandes modelos lingüísticos. Google está trabajando en LaMDA y hay otras empresas. Entonces, podríamos decir ChatGPT aquí hoy, pero nos referimos a esta tecnología en general. En realidad, estamos trabajando con las API que hay detrás, no con ChatGPT, que ahora solo está disponible a través de la interfaz de usuario.

“Antes, era algo así como, 'Oye, hazme este poema sobre lo que sea'. Ahora, puedes tener una conversación de ida y vuelta. Así es como los humanos interactuamos entre nosotros”

emmet: si Y creo que una de las cosas interesantes de ChatGPT es que, en cierto modo, no es tan nuevo desde el punto de vista técnico. ChatGPT es una aplicación creada con GPT-3.5 creada por una empresa llamada OpenAI. Pero GPT-3.5 ha existido por un tiempo, varios meses, ¿verdad, Molly? Entonces, tengo curiosidad. Gustavs, ¿cuál fue tu reacción? ¿Por qué cree que hay una reacción diferente a lo que estamos viendo con ChatGPT en comparación con la tecnología subyacente, que estuvo disponible durante algún tiempo?

Gustavs: Creo que la gran diferencia es que la presentación es como una conversación en la que puedes hacer preguntas de seguimiento y profundizar. Antes, era algo así como: "Oye, hazme este poema sobre lo que sea". Ahora, puedes tener una conversación de ida y vuelta. Así es como los humanos interactúan entre sí. Por lo tanto, es mucho más familiar que darle un aviso único. Cuando estaba jugando con ChatGPT cuando acababa de salir, se sentía como magia. Era realmente difícil de creer que esto existe. Y seguí jugando con él, hablando de diferentes temas, y se sentía como tener un tutor personal a pedido que sabe todo sobre todo. Hablaba de todo tipo de cosas sobre tecnología, historia, psicología e incluso comedia. Resulta que es realmente bueno para inventar comedia stand-up si le das una buena indicación. Fue muy divertido hacer eso también.

Un caso de alucinaciones

Emmet: Ambos han pasado varias semanas trabajando con esto ahora. Todos tuvimos esa reacción inicial muy impresionante, pero después de haber pasado algunas semanas tratando de aplicar esto a los problemas reales de los clientes, tal vez luchando con la aplicación directa de alguna manera, ¿resiste la exageración, Gustavs?

Gustavo: Si. Tan pronto como salió ChatGPT, quedamos realmente impresionados y nos dimos cuenta de que teníamos que comprender mejor lo que significa para nuestro negocio. Parecía que podría tener un impacto realmente significativo en toda la industria de servicio al cliente, por lo que formamos un pequeño grupo de trabajo y exploramos en qué es bueno ChatGPT, en qué es malo y qué podría significar para nuestro negocio. Después de pasar por ese ejercicio, mis propios miedos y preocupaciones y la exageración se redujeron un poco. Parece que la tecnología aún no ha llegado para tomar nuestros trabajos y automatizar todo.

“La modelo quiere complacerte, por eso quiere darte una respuesta que cree que quieres”

Resulta que es realmente bueno en algunas cosas, pero no en todo. Es bueno, por ejemplo, en cosas como resumir contenido o comprender el lenguaje y la edición y la escritura creativa. Pero tiene un gran defecto de alucinaciones, donde simplemente inventa cosas que suenan muy reales pero que son objetivamente incorrectas, lo que obviamente es un gran problema para una solución de servicio al cliente. No desea dar respuestas que suenen plausiblemente, pero que sean objetivamente incorrectas. Pero hay muchas cosas interesantes a las que puedes aplicarlo. Y creo que la gran conclusión es que esta tecnología está evolucionando muy rápido. Y realmente es solo cuestión de tiempo antes de que pueda dar respuestas objetivamente correctas. Y una vez que eso suceda, va a ser realmente disruptivo.

Emmet: Entonces, lo que estás diciendo es que dará una respuesta pase lo que pase. Y en algunos casos, esto resulta en lo que llamaste alucinaciones. Molly, esto parece una gran limitación para cualquiera que intente usar esto de verdad. ¿Qué son las alucinaciones y por qué ocurren en primer lugar?

Molly: Sí, es un gran problema, como dijo Gustavs. El modelo quiere complacerte, por lo que quiere darte una respuesta que cree que quieres. A veces, tiene una fuente confiable para esa información y, a veces, solo está inventando cosas. Se siente como un niño. "¿Por qué hiciste eso?" "Bueno, pensé que eso era lo que querías". La alucinación podría provenir de muchas fuentes diferentes. Si le hace una pregunta sobre Intercom, no necesariamente sabe nada nuevo. Y entonces, podría tomar partes de lo que sabe que es conocimiento general preciso de otros lugares, interpolar eso y, de alguna manera, tratar de usar el sentido común, que, por supuesto, no tiene. Realmente no tiene capacidades de razonamiento. Utiliza probabilidades como, "Bueno, esto probablemente podría funcionar de esta manera, así que puedo inventar una respuesta sobre algo sobre la API de Intercom", o algo así. Y como dijo Gustavs, es súper plausible. Suena muy confiado.

Y como mencionaste, diferentes compañías se están enfocando en cosas diferentes. Hay empresas que se centran un poco más en cómo minimizar las alucinaciones. Mientras que ChatGPT, creo, a menudo se enfoca mucho en las medidas de seguridad y la ética y en ser claro sobre lo que se niega a responder.

Emmet: ¿Crees que veremos una proliferación de montones y montones de modelos diferentes y puedes elegir el que mejor se adapte al tipo de compensación entre ser absolutamente correcto y las alucinaciones que deseas, o es un problema que puede simplemente desaparecen a medida que los modelos maduran?

“ChatGPT ilustró algo interesante, y es que la UI y la UX de todo esto son muy importantes”

Molly: No estoy segura de que desaparezca. Pero sí, ya hay un montón de modelos. Hay modelos de código abierto y existe el potencial de hacer lo que llamamos ajuste fino sobre un modelo. GPT significa transformador preentrenado generativo, por lo que genera cosas. Está pre-entrenado en un corpus grande y transformadores. Diferentes empresas se van a centrar en cosas diferentes. Hay modelos de código abierto, e Intercom, como usuario potencial de estos modelos, podría ajustarse en la parte superior para obtener un conocimiento más especializado de nuestra industria o empresa. La tecnología también mejorará en el uso y la necesidad de menos datos para tener un gran modelo. Y así, los modelos se harán cada vez más y más pequeños. Y potencialmente, en ese punto, podría ser mucho más razonable para una empresa más pequeña crear un modelo en sus datos y que sea bastante especializado, bien informado y muy confiable.

Emmet: Cambiemos de tema y hablemos más específicamente sobre el diseño. Claramente, GPT e IA, en general, han sido principalmente una historia tecnológica, pero creo que ChatGPT ilustró algo interesante, que es que la UI y la UX de todo esto son muy importantes. Parece haber un cambio hacia las interfaces de usuario conversacionales, potencialmente, por ejemplo. ¿Crees que eso es cierto? ¿Cuál es el papel del diseño en la configuración de lo que hacemos con esta tecnología de aquí, Molly?

Molly: Quiero decir, Intercom está muy bien posicionado. Nuestro negocio se trata de conversación y servicio al cliente, y la gente está muy emocionada por tener conversaciones con esta tecnología. Pero lo que descubrimos recientemente es que, al menos por el momento, hay tanto poder disponible en la tecnología que en realidad no es directamente conversacional, sino que se trata de conversación y lenguaje.

Como mencionamos, es excelente para resumir, y hay un montón de flujos de trabajo en los que el resumen realmente puede ayudar a los agentes de servicio al cliente. Recientemente lanzamos una versión beta para algunos clientes, y el resumen es una de las cosas que la gente encuentra realmente valiosa. También hemos agregado algunas herramientas de texto generativo para permitir que los representantes realicen modificaciones en sus mensajes si desean reformular las cosas, hacerlos más amigables, hacerlos un poco más formales u obtener ayuda para aclarar las cosas. Eso es parte de la conversación, pero no es tener una conversación directa con ChatGPT. También lo encontramos útil para ayudar a generar cosas como artículos del centro de ayuda, que también formaba parte de esta versión beta. Gran parte del poder de esto se encuentra en algunas de las aplicaciones más ocultas que no son tan obvias para los legos pero que realmente consumen mucho tiempo para los representantes. Y podemos proporcionar mucho valor con eso.

“Estás buscando esa intersección de cosas en las que la tecnología es buena y cosas en las que hay un riesgo relativamente bajo. Y veremos muchos de esos en los próximos meses”

Gustavo: Si. Hay muchas formas en las que puede usar esta tecnología y, a través de eso, eludir algunos de los problemas que hemos visto, específicamente con las alucinaciones, donde se inventan cosas que no son correctas. Pero es muy bueno en otras cosas. Es bueno para reformular el contenido existente, y tiene sentido comenzar con eso porque puede ofrecer un valor claro. El objetivo final sería estar completamente automatizado y dar respuestas. Es solo que la tecnología aún no es lo suficientemente buena para eso. Pero creo que llegaremos allí.

Emmet: Y sospecho que así es como veremos las cosas a lo largo de 2023 porque me imagino que comenzaremos a ver que esto se abre camino en muchos productos diferentes, probablemente en formas relativamente simples e infalibles para empezar y luego empujando cada vez más el barco. en términos de la complejidad de lo que puede hacer. Creo que todos nos hemos acercado a esta oportunidad con una combinación de entusiasmo y tal vez también un poco de temor saludable. Molly, mencionaste que tenemos estas funciones respaldadas por ChatGPT en versión beta en este momento. Y la respuesta ha sido extremadamente alentadora y positiva. Los primeros signos que estamos viendo son clientes reales que obtienen una utilidad real de funciones como resumir una conversación antes de pasarla a otra persona. Está buscando esa intersección de cosas en las que la tecnología es buena y cosas en las que existe un riesgo relativamente bajo. Y veremos muchos de ellos en los próximos meses. Entonces, eso va a ser emocionante.

IA conversacional

Emmet: Gustavs, has estado pensando en esto más a largo plazo. ¿Podrías hablar un poco de eso? Mencionó Intercom: una de las razones por las que estamos aquí hablando de esto es que probablemente estamos bastante bien posicionados, dada la naturaleza de nuestros productos, que es un servicio de atención al cliente conversacional, para aprovechar esto al máximo. ¿Qué piensas cuando piensas en oportunidades de diseño y productos a largo plazo?

Gustavs: En los primeros días del lanzamiento de ChatGPT, hicimos este taller para tratar de pensar en el futuro, específicamente sobre cómo sería el mundo si tuviéramos un modelo que no tuviera este problema de alucinaciones y pudiera dar buenas respuestas o decir “No sé”. Ha sido realmente prometedor y realmente ha aumentado nuestra confianza en muchas cosas en las que ya creíamos pero que se están acelerando. Creemos que la mayoría de las consultas de soporte se resolverán de forma completamente automática sin hablar con humanos. Ya está aumentando hoy con más constructores del tipo "si esto, entonces aquello", con bots y nuestro propio bot de resolución, que tiene algunas capacidades de aprendizaje automático, pero no en la misma medida que ChatGPT.

“La mayor parte del apoyo ocurrirá de la manera más natural para los humanos, que es a través de la conversación”

Ya estamos en ese camino, pero se va a acelerar. Y como resultado de eso, las organizaciones de soporte comenzarán a pasar de ser reactivas y principalmente en la bandeja de entrada a ser proactivas: configurar y entrenar la IA; escribir contenido que la IA pueda usar para resolver conversaciones.

Creo que la mayor parte del apoyo ocurrirá de la manera más natural para los humanos, que es a través de la conversación. Imagínese si tuviera a alguien con quien siempre puede hablar que tiene una respuesta personalizada solo para usted. Esa es la forma más natural para que los humanos interactúen. Esta experiencia de búsqueda y exploración que tenemos hoy, en la que buscas algo en Google y lo escaneas para tratar de encontrar rápidamente respuestas en algún lugar del contenido, no es tan natural para los humanos. Todavía habrá algunas versiones de eso con sugerencias de contenido que podría ser relevante para usted antes de comenzar una conversación. Pero cuando interactúas con él, aún podría ser conversacional.

Creemos que también tendremos que construir un puente para llegar allí por múltiples razones. Creo que comenzaremos viendo el aumento de representantes de soporte con cosas como resúmenes o reformulaciones. Más tarde, entraremos en sugerencias de respuestas que los representantes de soporte pueden editar y mejorar, y luego, entraremos en la automatización completa. Tomará un tiempo, tanto para la tecnología como para el aspecto humano, acostumbrarse a usar más y más automatización.

Emmet: Estás describiendo algo donde, a lo largo de un área de superficie muy amplia del producto, hay muchos lugares diferentes donde esto puede cambiar la forma en que trabajamos, tanto lo que llamamos la experiencia del compañero de equipo como la experiencia del usuario final, en los dos lados de la conversación. Pero también estás describiendo esta noción confusa de cómo vamos a llegar a este vago futuro de “creemos que la tecnología llegará allí”. Me parece una forma muy diferente de pensar acerca del diseño actual y una diferencia casi profunda en la forma en que pensamos acerca de la interacción con las computadoras, pasando de algo muy determinista, muy definido, de verdadero y falso y unos y ceros, a algo mucho más borroso.

Nuevos patrones de diseño

Emmet: Los diseñadores ahora están considerando trabajar con este material que se siente mucho más incognoscible y plástico y menos rígido que las aplicaciones CRUD, "crear, escribir, actualizar, eliminar", a las que estamos acostumbrados. ¿Qué has encontrado? ¿Existe una diferencia sustancial en la forma en que los diseñadores deben abordar su trabajo? ¿Ha encontrado ciertas cosas difíciles o desafiantes? ¿Los diseñadores tendrán que aprender nuevas habilidades? ¿Qué tan grande es este cambio para el acto de diseñar, el hecho de que el material con el que estamos diseñando casi tiene este elemento de incognoscibilidad incorporado?

“Con el tiempo, veremos surgir más y más nuevos patrones de diseño sobre cómo manejar esta incertidumbre y expectativas en todos los lados”

Molly: Creo que todavía hay muchas cosas en nuestro trabajo que seguirán siendo las mismas. Estamos encontrando problemas, indagando en los flujos de trabajo de las personas, encontrando patrones. Una gran cosa es la necesidad de diseñar para muchos más casos de falla porque no necesariamente hay barandas. Cuando estás teniendo una conversación, puede descarrilarse de muchas maneras diferentes. Y es lo mismo con un sistema como este. Los humanos, como especie, no somos buenos en las probabilidades. Cuando miramos el informe meteorológico y hay un 40% de probabilidad de lluvia, no tenemos una idea muy clara de lo que eso significa.

Emmet: Sí, estás decepcionado si no llueve porque te dijeron que llovería.

Molly: Sí. Estoy en los Países Bajos, cuando veo alguna posibilidad de lluvia, digo: “Lloverá. Es solo una cuestión de cuánto tiempo”. Eso es lo que los porcentajes significan para mí. Pero no somos tan buenos interpretándolos. Creo que eso definitivamente va a ser algo a medida que observamos qué tan confiables son estas predicciones porque son predicciones de qué palabras deberían venir a continuación. Y buscaremos mejorar en eso. Hay mucho que ver con la rapidez con la que se mueve y cambia esta tecnología, y no creo que eso vaya a cambiar. Hay muchos prototipos, reacciones y pensamientos sobre la latencia. La latencia en este momento puede ser bastante larga: diseñar para eso. Y hay muchos resultados inesperados. Esas son algunas de las cosas que he estado notando.

Gustavs: Creo que, con el tiempo, veremos surgir más y más nuevos patrones de diseño sobre cómo manejar esta incertidumbre y expectativas en todos los lados. Por el momento, todos están experimentando y viendo qué funciona. Ya estamos viendo algunos patrones emergentes con pequeñas indicaciones predefinidas sobre cómo cambiar el texto como "expandir esto", "resumir esto", "hacerlo más amigable". Es un patrón relativamente nuevo que está comenzando a surgir, y creo que veremos más y más de ese tipo de patrones. Incluso esta interacción donde, si le pides a ChatGPT que genere contenido, tiene este cursor que se mueve lentamente. Ese es un patrón de diseño interesante también. Es técnicamente necesario, pero podría funcionar muy bien para establecer expectativas de que, "oye, esto es IA que genera contenido sobre la marcha".

“En estos nuevos sistemas que podrían estar muy automatizados, ¿estamos pensando en volver a agregar algo de fricción para conservar las habilidades que se sienten valiosas y que queremos tener?”

Emmet: Entonces, estás diciendo que este efecto de escritura palabra por palabra, que es, para ser claros, una función de cómo la tecnología lo hace palabra por palabra, podría convertirse en sinónimo y en una tarjeta de presentación visual. . Tal vez eso suceda, tal vez no, pero el tipo de cosas que tienden a surgir cuando vemos estos cambios y surgen nuevas tecnologías podría ser interesante para profundizar en la idea de nuevos patrones de diseño emergentes porque vemos esto cuando surgen nuevas tecnologías. a lo largo de. Molly, ¿hay otros que haya encontrado, ya sea en un nivel de diseño de interacción muy bajo o en el nivel alto de cómo esto se une a los productos?

Molly: Hay un par de otras cosas que creo que comenzarán a aparecer más. Por ejemplo, cuando estamos tratando de desarrollar una función, los ingenieros están realizando pruebas retrospectivas. Están usando datos pasados ​​y haciendo predicciones sobre eso y luego comparándolos con lo que dijo un compañero de equipo, por ejemplo. Para cosas como esa, es posible que debamos comenzar a lanzar no en el usuario final, sino en el lado del compañero de equipo o del administrador, donde las personas que administran una organización de CS pueden querer tener lo que yo llamo un lanzamiento oscuro: no tienen cosas en vivo pero son poder verlos y tener la sensación de: "Está bien, ahora confío en que esto funcione". Diferentes etapas de lanzamientos oscuros, borradores de sugerencias y diferentes etapas de lanzamiento de algunas de estas herramientas. Creo que será más prominente.

No sé en qué dirección irá, pero pienso en los puntos en los que podríamos tener que volver a agregar fricción al sistema para no caer en la autocomplacencia. Los pilotos todavía hacen ciertas partes de un vuelo, aunque el sistema de piloto automático hace la mayor parte, porque no necesitan olvidar cómo volar. Entonces, están haciendo los aterrizajes u otras cosas. En estos nuevos sistemas que pueden estar muy automatizados, ¿estamos pensando en volver a agregar algo de fricción para conservar las habilidades que se sienten valiosas y que queremos tener?

Emmet: Y claramente, casi todo tiene un puntaje de confianza implícito para la característica integrada que tienes que diseñar. ¿Es esto algo que expondríamos a los representantes y administradores o a sus clientes? Hay un umbral más alto para nosotros para exponer cosas a sus clientes o incluso en un nivel más bajo de detalle. Tome la capacidad de resumir una larga conversación. ¿Publica ese resumen directamente en el hilo de conversación con solo hacer clic en un botón, o le da a alguien la oportunidad de revisarlo y aprobarlo? ¿Dejarlo pasar directamente en lugar de agregar una puerta de aprobación? Creo que probablemente veremos surgir muchos flujos de trabajo, al menos inicialmente, y luego, ¿comienzan a caer a medida que la tecnología genera una confianza cada vez mayor?

Molly: Sí, exactamente.

Gustavs: Incluso la capacidad de decirte qué tan seguro es. Si la IA pudiera decirte: "Oye, esta es mi respuesta y es correcta en un 40 %", podrías presentarla para que una persona la apruebe antes de enviarla. Si tiene un 90 % de confianza, puede seguir adelante y enviarlo de inmediato y tener un botón "oye, esto es incorrecto" en el lado del usuario final. Realmente depende de cómo evolucione la tecnología. El diseño tendrá que evolucionar a la par.

emmet: si Dios, concédeme la confianza de un gran modelo de lenguaje porque dirá con absoluta confianza una falsedad total y una verdad total sin distinguir entre ellas. Y eso es lo de la confianza. Por el momento, no hay nada que diga: "Estoy 100% seguro de esta afirmación". En ChatGPT, al menos. En algunos de los otros modelos de lenguaje, creo que estamos empezando a ver fuentes referenciadas, lo que parece un paso positivo.

Agregar capas en la parte superior

Emmet: Parece que hay muchas cosas desconocidas, muchas decisiones esenciales y de diseño profundo como esta en las que involucrarse. Acerquémonos a lo que significan estas megatendencias para el diseño y el producto. Las personas han sido testigos o han sido parte de la llegada de grandes tecnologías nuevas. Estoy pensando en cosas como la nube o el cambio masivo a la web y los dispositivos móviles como grandes tecnologías habilitadoras que llevaron a todo este nuevo mundo de patrones de diseño y productos que no estaban disponibles antes. Con la nube, vimos formularios, feeds, me gusta y toda la transformación visual por la que pasó la web.

Se podría decir mucho de lo mismo para dispositivos móviles: todo, desde feeds y menús de hamburguesas hasta tirar para actualizar y deslizar para eliminar, que ahora consideramos parte del conjunto de herramientas de un diseñador. Tal vez nos estemos acercando peligrosamente al tiempo de predicción, pero ¿cuál es su primera experiencia trabajando con esto? ¿Le dice algo sobre qué tipos de productos van a ganar o perder y qué cosas nuevas podríamos ver surgir que ni siquiera eran posibles antes?

"Creo que las empresas que van a ganar son las que tendrán algún tipo de datos patentados y un efecto de volante que recopila y mejora continuamente esos datos".

Gustavs: Creo que, con el tiempo, la mayoría de las empresas usarán estos modelos de lenguaje grande disponibles públicamente en lugar de crear los suyos propios. Pero para diferenciarse unos de otros, pueden construir capas encima de ellos con conocimientos especializados. Por ejemplo, puede tener datos específicos de la empresa: para una herramienta de soporte, podrían ser respuestas a preguntas específicas sobre su producto y sus representantes de soporte brindan respuestas específicas en lugar de conocimiento generalizado. Podría ser un conocimiento realmente profundo de un campo en particular, como el derecho.

Las empresas que van a ganar, creo, son las que tendrán algún tipo de datos patentados y un efecto volante que recopilará y mejorará continuamente esos datos. La otra cosa que creo que va a ser interesante es ver qué hacen los grandes jugadores como Google, Apple y Microsoft con esta tecnología y cómo la integran al nivel del sistema operativo. Eso podría tener un gran impacto en el tipo de nichos disponibles para otras empresas.

"OpenAI está perdiendo millones al día para ejecutar ChatGPT, y probablemente valga la pena desde el punto de vista de las relaciones públicas o cualquier dato de investigación que estén recopilando, pero también significa que no será gratis ni placentero".

Emmet: Comenzaste diciendo que la mayoría de la gente va a integrar estos grandes modelos de lenguaje de cierta manera. Creo que las empresas que no logran hacer lo que usted decía, y en realidad encuentran algún tipo de foso defensivo, se encontrarán básicamente como un envoltorio delgado sobre GPT que en realidad no hace mucho más. Entonces, estoy totalmente de acuerdo contigo en eso. Si piensas en algo como la App Store o las tiendas de aplicaciones móviles, había muchos juguetes y linternas y cosas así en los primeros días. Y luego, gradualmente, se convierte en grandes cosas habilitadoras como Uber, que no podría existir si no tuviéramos este modelo, e Instagram y el mapeo, etc. Molly, ¿algo que te gustaría agregar basado en tu experiencia?

Molly: No estoy totalmente segura de que todos usen LLM públicos. Tengo un pequeño temor de que sean demasiado caros para que muchas empresas hagan que su modelo de negocio funcione o que algunas de las grandes empresas puedan mantenerlos en privado. Por lo tanto, no estoy seguro de si todos usarán los públicos o si la gente se moverá más hacia el código abierto y pondrá su capa afinada en la parte superior. Estoy de acuerdo con los modos de datos. Por ejemplo, en Intercom, tenemos muchos datos conversacionales y podemos hacer cosas que Apple no necesariamente puede hacer a nivel de sistema operativo. Y eso nos proporciona algo de valor. Creo que los productos que tendrán éxito serán los que, como dijiste, no sean solo una capa de productos básicos en la parte superior, sino que comprendan profundamente un problema o flujo de trabajo y puedan integrarlo con su modo de datos.

Emmet: También mencionaste un par de cosas que, por el momento, van a ser importantes en torno a las limitaciones. Es lento. Se tarda unos segundos en devolver una respuesta. Habrá algunos productos o espacios en los que simplemente no es adecuado. También es costoso en términos de poder de cómputo y, por lo tanto, costoso en términos de dinero. Probablemente sepa más que yo sobre esto, pero cada solicitud cuesta un par de centavos. OpenAI está perdiendo millones al día para ejecutar ChatGPT, y probablemente valga la pena desde el punto de vista de las relaciones públicas o cualquier dato de investigación que estén recopilando, pero también significa que no será gratis ni placentero. Y si bien la tecnología tiene la muy buena costumbre de volverse más rápida y económica con el tiempo, y esto potencialmente podría suceder aquí, por el momento, existen ciertas limitaciones que restringen la aplicación. Tal vez lo veamos menos en las aplicaciones en tiempo real. Tal vez lo veamos menos en las aplicaciones B2C, donde la escala y el costo de ejecutar ese tipo de consultas podrían ser enormes. Va a ser interesante ver cómo emergen las cosas allí también.

El futuro de la interfaz

Emmet: Tengo curiosidad por profundizar en términos de la conversación de diseño y pensar realmente en estos sistemas generativos y cómo vamos a interactuar con ellos. Estamos aludiendo a todos los nuevos toques y deslizamientos y cosas que puede hacer cuando aparece una nueva plataforma. Aquí es donde inevitablemente tendremos que entrar de puntillas en el mundo de la predicción. Todos podemos mirar hacia atrás en uno o dos años y reírnos de lo equivocados que estamos, pero hay una sensación interesante de que tal vez esto esté cambiando hacia una forma de interactuar más basada en texto, casi en línea de comandos. Otro tipo de microtendencia en el producto ha sido esta paleta de comando + K que puede abrir presionando un atajo y escribiendo la acción que desea realizar. Vemos eso en muchos productos, lo que está contribuyendo a esta sensación general de un cambio hacia el texto y el lenguaje natural como una forma directa de interfaz.

“No creo que tengamos que elegir una forma de interactuar con la IA. Es una capacidad muy amplia que se puede aplicar de diferentes maneras para diferentes casos de uso”

Por otro lado, si observa las tendencias anteriores, especialmente el viaje que hicimos desde la interfaz de línea de comandos, terminamos construyendo interfaces gráficas de usuario muy detalladas en la parte superior. Y entonces, me pregunto si le importaría especular sobre hacia dónde ve que va esto. ¿Esto augura un cambio hacia más interfaces de línea de comandos para el siglo XXI? ¿Es esto una línea de comandos temporal antes de que descubramos cómo se ve una capa de interfaz gráfica de usuario en estas cosas? ¿Es demasiado pronto para decirlo?

Gustavs: Bueno, creo que tendremos todos esos. No creo que tengamos que elegir una forma de interactuar con la IA. Es una capacidad muy amplia que se puede aplicar de diferentes maneras para diferentes casos de uso. Entonces, por ejemplo, si está buscando una respuesta, la conversación será la forma principal de obtener una respuesta. Pero si estamos hablando del aumento del flujo de trabajo con IA, creo que veremos interfaces gráficas con acciones predefinidas para que las realice la IA. Es lo mismo que estamos viendo hoy con resumir, reformular y toda la ola de copiloto para X.

Con la automatización del flujo de trabajo, me refiero a usar IA para mejorar la forma en que hace su trabajo. Entonces, por ejemplo, en la atención al cliente, es cuando escribe respuestas a los clientes que usan IA para mejorar esas respuestas. Nuevamente, expandir un punto o resumir la conversación hasta ese punto. Creo que podría haber interfaces gráficas para esos tipos de aumento de flujo de trabajo.

Molly: Soy terrible con las predicciones, pero es posible que tengamos una especie de proliferación de, como dijiste, interfaces de comando + K o diferentes opciones de lo que puedes hacer. Uno de los desafíos con esta tecnología es la capacidad de descubrimiento de lo que puede hacer. Puede escribir cualquier cosa en este indicador. “Escríbeme un poema de Shakespeare como un pirata”, o algo así. Pondremos algunas medidas de protección, pero creo que probablemente seremos amplios y luego veremos que las cosas se reduzcan un poco a medida que las cosas se vuelvan más comunes y útiles. Y luego, eventualmente, tal vez podamos ir a una interfaz más abierta basada en texto o basada en conversaciones una vez que tengamos una idea de lo que esta tecnología puede hacer.

A medida que nos acostumbramos a hablar con nuestros sistemas, también estoy entusiasmado con el potencial de las interfaces neuronales. ¿Por qué hablar de ello si sólo puedo pensarlo? Sé que falta mucho para eso, pero cuando estaba en Berkeley, algunos de mis colegas estaban trabajando en eso. Sería genial. Hay muchas situaciones en las que no quieres hablar y escribir, y esto abre las cosas. Tal vez más adelante en el futuro, tendremos sistemas integrados que pueden tomar instrucciones que no son GUI y traducirlas en acciones. Ya lo estamos viendo con algunos de estos sistemas que pueden tomar consultas e instrucciones en lenguaje natural y convertirlas en acciones en su computadora. Y el hecho es que algunos de estos LLM también son muy buenos para generar código, como el copiloto de GitHub. Y entonces, hay mucho potencial allí.

Emmet: Sospecho que la manipulación de texto va a tener un gran año en software porque aquí hay muchas posibilidades inmediatas. Se siente muy natural poder resaltar un fragmento de texto y decir "hazlo más amigable". Casi parece que pertenece a la paleta de herramientas junto con negrita y cursiva. Es solo una forma de manipular el texto existente. Luego, hay muchas formas de llevar eso más allá, como la generación o la generación de código.

Personalmente, la experiencia de trabajar con generadores de imágenes me pareció bastante diferente. Una vez más, gran parte de nuestra experiencia con estos sistemas es ver cómo se desplazan los resultados, como capturas de pantalla de ChatGPT o algo creado por DALL-E, Midjourney o Stable Diffusion. El proceso de creación de los generadores de imágenes me parece torpe, y es probable que tenga una interfaz gráfica de usuario y una interfaz en pantalla mucho más táctil. Tener que rellenar el indicador con tendencias cortas de F-stop en arte desviado para intentar que cree los resultados que desea es claramente un truco. Y hay muchas dimensiones de diferentes estilos por los que desea pasar que estarían mucho mejor atendidos por perillas, diales y controles deslizantes de algún tipo. Supongo que mi predicción es que veremos que la ingeniería rápida, tal como existe hoy, será reemplazada por algo, con suerte, mucho mejor.

"Hay algo interesante en el hecho de que la IA sea como un colega con superpoderes que puede usar las herramientas que tienes y puedes brindarles comentarios de texto sin formato para ayudar a mejorarlas".

Y solo para terminar el pensamiento, el video y el audio son muy diferentes porque tienes que sentarte durante mucho tiempo y revisar los resultados. Puedes observar cientos de imágenes o leer un texto, pero honestamente tengo menos opiniones al respecto porque he podido dedicarle menos tiempo. Pero supongo que vuelve a lo que estabas diciendo en última instancia, Gustavs. No es una respuesta satisfactoria, pero va a depender enormemente. Y creo que dependerá mucho de qué es lo que estoy manipulando. Y podríamos tener interfaces de usuario muy diferentes para eso dependiendo.

Gustavs: Al mismo tiempo, creo que habrá nuevas aplicaciones interesantes para dar instrucciones en lenguaje natural. Por ejemplo, una cosa que encontramos interesante cuando hicimos nuestra exploración inicial fue que la forma en que podrías entrenar a la IA podría ser muy, muy similar o prácticamente igual a si la IA fuera un agente de apoyo y les darías retroalimentación sobre tu política sobre cómo interactuar con los clientes o qué tono de voz usar. Incluso cuando brinde comentarios sobre conversaciones individuales, puede hacerlo en texto sin formato porque comprende el lenguaje natural y el contexto. Creo que también lo veremos. Y hay algo interesante en el hecho de que la IA sea como un colega con superpoderes que puede usar las herramientas que tiene y puede brindarles comentarios de texto sin formato para ayudar a mejorarlas.

Emmet: Molly se refirió a lo que sucede cuando estas cosas no solo escupen texto, sino que también pueden realizar acciones, por ejemplo. Y eso es probablemente un nivel adicional completo de lo que son capaces.

¿A dónde vamos desde aquí?

Molly: Fergal, para aquellos de ustedes que escuchan algunos podcasts anteriores, es el Director de Machine Learning. Él dice que su ideal para un sistema ML debería ser como un colega inteligente sentado a su lado a quien puede dar instrucciones y realmente lo ejecutará bien. Ese es el tipo de sueño. Entonces, como dijo Gustavs, poder dar retroalimentación en lenguaje natural es solo este cambio radical en la forma en que podemos manejarlo.

"¿Cómo hacemos de este colega inteligente, que podría ser potencialmente amenazador, un compañero de equipo que te está haciendo mejor?"

Emmet: Incluso me pregunto cuánto rango habrá. Hubo una agencia llamada Berg en Londres hace unos años, e hicieron muchos experimentos con iteraciones anteriores de IA. Pero uno de sus principios era "ser tan inteligente como un cachorro" porque no querían que la IA se sintiera amenazante o abrumadora. Y ese era su principio al trazar límites a nuestro alrededor. No me gusta forjar a los diseñadores como del tipo "no puedes hacer eso", pero tal vez establecer esos límites seguros es un papel importante para los diseñadores también.

Molly: Creo que hay un papel para esos límites. Quiero trabajar al lado de un cachorro, pero ¿quieres trabajar al lado de alguien con la inteligencia de un cachorro? Creo que el papel de los diseñadores es: ¿cómo hacemos que este colega inteligente, que podría ser potencialmente amenazador, un compañero de equipo que lo está haciendo mejor, pueda tener esta excelente sesión de pizarra e intercambio de ideas en la que simplemente está hablando de cada uno? ¿otro? ¿Cómo llegamos a eso? Ahí es donde realmente podemos agregar esta magia: mejorar la jornada laboral, aumentar los flujos de trabajo y hacer de la IA un compañero de equipo real para las personas.

Emmet: Los autos sin conductor son probablemente la aplicación más avanzada de IA en la actualidad, aunque no se encuentra en un nivel de adopción amplio. La tensión de estos niveles de conducción autónoma y el aumento del riesgo a medida que pasas por esos niveles: una versión de eso probablemente se aplica a muchas de estas cosas, si lo piensas.

Molly: Sí, quiero decir, eso es exactamente lo que ya mencionamos. ¿Es una sugerencia? ¿Hay una revisión? ¿Hay aprobación? Esa es solo nuestra versión de los cinco niveles de vehículos autónomos.

Gustavs: Otra cosa interesante es que, con el tiempo, a medida que la IA mejora y es capaz no solo de dar respuestas, sino también de realizar acciones en su nombre, de forma similar a como lo haría un colega, será un desafío de diseño interesante de resolver. encontrar una manera de hacer que se sienta como si alguien se sentara a su lado y lo ayudara, en lugar de un pirata informático que secuestra su computadora y hace clic en las cosas. Si puedes hacer que funcione con el diseño, se sentirá mágico. O podría ser una locura de miedo. Va a ser un desafío de diseño interesante.

Emmet: Y es posible que la ruta conversacional sea la mejor manera de hacerlo. También será interesante ver el grado en que se enmarca como una persona amistosa y conversacional en comparación con el sistema con el que interactúas a distancia.

“¿Cambiará mucho la naturaleza de la producción y el trabajo de ideación? ¿Tendremos que aprender nuevas habilidades como ingeniería rápida?”

Hace un par de años, tuvimos lo que, en retrospectiva, se podría considerar como un ciclo de exageración de bots. Y, de hecho, Intercom participó activamente en la experimentación y en descubrir lo que podíamos hacer. Por supuesto, tenemos productos que aprovecharon eso, como ya mencionamos. Cosas como el bot de resolución y los bots personalizados. Pero también descubrimos durante ese ciclo de publicidad que hay un montón de aplicaciones que no son buenas para la interfaz de usuario conversacional. Había un bot meteorológico, y dices: "En realidad, no necesito un bot para preguntar qué tiempo hace, tengo una aplicación o una página web que está bien para eso". Inevitablemente veremos mucho de eso suceder aquí también. Probablemente una aplicación excesiva de la interfaz de usuario conversacional, pero luego los casos de uso verdaderamente útiles pasan a primer plano.

Una cosa adicional que agregaré que me hace bastante optimista sobre el tema de la conversación es un problema en el que hemos estado trabajando durante mucho tiempo. La prueba de Turing no es nueva. Pero aparte de eso, trabajé en Google hace varios años. Hubo una gran cantidad de trabajo en la búsqueda y el orgullo de lograr que respondiera a una pregunta como "¿Qué altura tiene la Torre Eiffel?" Algo que parece súper básico en comparación con lo que ahora tenemos disponible. Incluso los asistentes de voz como Siri se despertaron repentinamente una mañana a fines de noviembre para estar casi obsoletos.

La velocidad a la que mejoran los sistemas también impulsará una gran parte de esto. Una de las cosas interesantes y nuevas para los diseñadores es que estamos en el camino en mayor medida que nosotros trabajando con tecnologías web o lo que sea en el pasado. A dónde vaya la tecnología desde aquí va a dictar las cosas tanto como nuestra visión autoral como directora como diseñadores.

"Creo que va a ser muy importante que los diseñadores se apoyen en esto y simplemente jueguen y jueguen con estos modelos de lenguaje y vean cómo pueden aplicarlos a su producto".

Una última dimensión en la que pienso en términos de diseño, específicamente, son las herramientas que usamos y el hecho de que tienen el potencial de cambiar dramáticamente. ¿Cambiará mucho la naturaleza de la producción y el trabajo de ideación? ¿Tendremos que aprender nuevas habilidades como ingeniería rápida? Gustavs, ¿algún pensamiento de alto nivel sobre lo que esto significa para la naturaleza cambiante de hacer diseño?

Gustavo: Si. Específicamente en términos de ingeniería rápida, creo que, con el tiempo, veremos el surgimiento de las mejores prácticas sobre cómo hacerlo de la misma manera que lo hemos hecho con cualquier otra tecnología. Y obviamente, evolucionarán y mejorarán con el tiempo, pero no creo que vaya a ser un diferenciador clave que dará forma fundamental a su negocio. Es difícil saber cómo cambiará el papel del diseñador, y depende del marco de tiempo. A corto plazo, creo que va a ser muy importante que los diseñadores se apoyen en esto y simplemente jueguen y jueguen con estos modelos de lenguaje y vean cómo pueden aplicarlos a su producto, cómo otras empresas lo aplican a los suyos y trata de encontrar patrones y formas interesantes de hacer cosas nuevas.

Pero a largo plazo, es mucho más difícil saber cuál será el impacto en los diseñadores de toda la industria. Entonces, a medida que la IA mejora, y no solo en el aumento de los humanos, sino también en la automatización completa de la escritura y la realización de tareas, creo que eso puede alterar fundamentalmente muchos productos e industrias e incluso el papel que desempeñan los diseñadores en la configuración de esos productos. Supongo que ya veremos. Muchas preguntas abiertas, y va a ser interesante ver cómo se desarrolla.

emmet: si Una de las cosas buenas de hacer lo que hacemos es que, ocasionalmente, la tecnología te brinda un nuevo tipo de camino que puedes seguir. Definitivamente se siente como si fuera algo que alterará sustancialmente el panorama en el que trabajamos y creará una tonelada de nuevos desafíos y oportunidades para los diseñadores. Para nosotros en Intercom, es muy emocionante estar bien encaminados y en ese camino y totalmente comprometidos con él. Será un año interesante para la IA y el diseño con IA, sin duda. Tengo muchas ganas de ver a dónde llegamos. Tal vez podamos dejarlo así. Molly, muchas gracias. Gustavs, un millón de gracias. Fue genial conversar contigo y aprender de tu experiencia anterior trabajando con esta tecnología. Tal vez lo haremos de nuevo cuando seamos mayores y más sabios, pero por ahora, muchas gracias.

Podcast de intercomunicación interior (horizontal) (1)