Interfaz de usuario impulsada por IA (también conocida como "Return of the Chat")

Publicado: 2023-08-11

La revolución de la IA es más grande que la tecnología móvil, más grande que la nube, y algunos en Intercom dicen que es incluso más grande que Internet.

Muchas de las proyecciones se basan en cómo las nuevas capacidades harán que el software sea mucho más poderoso: la capacidad de representar imágenes a partir de descripciones, escuchar/leer extensamente y resumir en segundos, diagnosticar problemas, categorizar temas y tomar medidas. todo a la velocidad del pensamiento. Todo este nuevo poder cambiará los productos de software de manera enorme, y ya estamos viendo destellos de eso. Otro cambio sustancial que espero es la aparición de Chat UI (también conocida como interfaz de lenguaje natural) como una interfaz estándar para los productos.

El ensayo épico/diatriba de Neal Stephenson "Al principio era la línea de comandos" (con razón) argumentó que las líneas de comandos son más efectivas y eficientes que las interfaces de apuntar y hacer clic (o tocar y deslizar). Lo que no son, sin embargo, es intuitivo o accesible para más de un pequeño porcentaje del mundo (a menos que haya adivinado que cambiar el tamaño de las imágenes es solo una simple find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \; lejos.)

La línea de comandos es una gran cantidad de comandos arcanos con nombres tontos y sintaxis complejas, pero el chat con tecnología LLM es mucho más indulgente. Hay una docena de formas diferentes de decir que desea cambiar el tamaño de una imagen, y los LLM comprenderán cada una de ellas.

Si lleva este mismo argumento a UI, encontrará cierta similitud. Por ejemplo, aquí está Workday, un producto valorado en $60 mil millones. Lo uso a regañadientes para solicitar tiempo libre, cuando puedo recordar cómo iniciar sesión. Seguro que es más fácil que la línea de comandos, pero sigue siendo una serie de pasos para encontrar el formulario correcto y completarlo.

Ahora pregúntese, ¿qué es más fácil, escribir "des quiere el 14 de octubre libre para el aniversario de bodas" o navegar por la interfaz de usuario anterior con sus interminables pestañas, botones fantasma y menús desplegables? Para obtener puntos de bonificación, pregúntese si alguna vez podría diseñar una interfaz de usuario general que sería más rápida que yo simplemente escribiendo "des quiere el 14 de octubre libre para el aniversario de bodas". No es fácil… De hecho, ya hemos visto surgir un gran apetito por las interfaces de teclado, y eso fue antes de que fueran tan intuitivas. Dicho de otra manera, ¿cuánto tiempo pasará antes de que Workday (al menos) agregue este tipo de interfaz de usuario?

(Está bien, te escucho, sí, podrían ser años).

Comenzamos con la fruta de la IA al alcance de la mano

Hoy vemos que los chatbots de IA prosperan en áreas donde ya esperábamos una interacción con un cuadro de texto, por ejemplo, motores de búsqueda, redacción de artículos, mensajeros de atención al cliente (¡hola, Fin!) Pero no se detendrá ahí, esos son los más fáciles y la mayoría de los casos de uso amigables con la radio para IA. Como diseñadores, es posible que no estemos listos para aceptar que la mayor parte de nuestro trabajo se destilará en un rectángulo redondeado, incluso uno con una tipografía bonita.

Pero vamos a ver cómo la interfaz de usuario del chat transforma los productos que antes estaban limitados por sus interfaces de usuario, idiomas o comandos necesariamente duros. Como un ejemplo relacionado, digamos que está en Excel y desea resaltar todas las celdas negativas en rojo, ¿cómo lo hace? La mayoría de nosotros vamos a Google, luego recordamos que la palabra que estamos buscando es formato condicional , y luego volvemos a buscar en Google "Formato condicional de Excel" y luego el cuadro de respuesta de Google explica qué hacer, así que volvemos a Excel y seguimos esas instrucciones robóticamente . Entonces instantáneamente guardamos en la memoria todo el conocimiento ganado temporalmente a lo largo del camino y volvemos a lo que sea que estábamos tratando de hacer en primer lugar.

Hoy, puedes pedirle a un bot que lo haga por ti. La interfaz de usuario de chat puede conducir a una gran democratización del acceso al software.

El software complejo mejora con Chat UI

La mayoría de los usuarios de productos empresariales son novatos perpetuos: saben lo suficiente como para hacer una o dos tareas que requieren con mayor frecuencia, pero más allá de eso, solo piratearán y desecharán su camino hacia un resultado. Tienen muchas nociones sobre las tareas que les encantaría realizar, pero simplemente no saben cómo. Este obstáculo aguas arriba se propaga aguas abajo y antes de que te des cuenta, simplemente dejas de pensar que el producto es bueno o puede resolver sus problemas. Si alguna vez ha perdido un cliente ante un competidor por una característica que ya tiene , ha experimentado este dolor.

Piense en Google Analytics, Salesforce o productos de su potencia y complejidad. Sabes que, enterrada en algún lugar profundo, se encuentra la respuesta correcta a una pregunta importante como "¿ dónde obtenemos nuestras fuentes de tráfico de mayor rendimiento y cuál es la nueva fuente más reciente?" , o "¿ qué competidores estamos viendo aumentar en las ofertas?" , pero no hay posibilidad de que puedas averiguarlo por tu cuenta. Entonces, o le pregunta a su experto local o inventa la respuesta y espera que nadie se entere.

Aprender la interfaz de usuario, incluso si es hermosa y elegante, rara vez vale la pena.

Pero , si puede simplemente escribir (o decir) lo que está tratando de hacer y ver cómo sucede, las barreras se desvanecen. Todos adquieren la experiencia, todos se convierten en usuarios avanzados y, de repente, el producto cambia las reglas del juego. Aquí hay una forma ridículamente simple de visualizarlo:

En todos estos productos hay usuarios que saben lo que quieren hacer pero no saben cómo hacerlo. La interfaz de usuario de lenguaje natural reduce esta brecha a casi cero.

Interfaz de usuario de chat de lanzamiento anticipado

Ya estamos viendo algunos ejemplos de este enfoque en la naturaleza.

  • Equals: Construido por dos ex Intercomrades, Equals es una hoja de cálculo de próxima generación con conexiones en vivo a datos en vivo. (Descargo de responsabilidad/divulgación: soy un inversionista). Le permite escribir lo que está tratando de hacer y Equals lo resolverá y generará los comandos de Excel que nunca supo y que no iba a poder resolver usted mismo. .

  • Mixpanel: la empresa de análisis de eventos anunció recientemente Spark, una interfaz de chat de IA generativa que le permite hacer una pregunta sobre sus datos, en un lenguaje sencillo.

  • Stripe: Stripe ha presentado una nueva función Radar que permite a los clientes utilizar el lenguaje natural para crear reglas complejas de prevención de fraude.

Si bien me estoy enfocando aquí en la interfaz de usuario del chat como mecanismo de entrada, es cierto que el chat como salida es más complicado porque, para muchos propósitos, la priorización visual, la jerarquía, el diseño, el diseño, etc., son superiores a una burbuja de chat. Por ejemplo, cosas como los tableros son elementos inherentemente visuales que no pueden ser reemplazados por una respuesta de texto. Sin embargo, puede haber muchos productos que vean que su interfaz de usuario se desvanece sustancialmente; por ejemplo, "Reservar vacaciones el 14 de octubre" → "Listo" es una interacción perfectamente aceptable.

Creo que ahí es donde irá el software: una comunicación multimodal y de métodos mixtos entre las personas y el software. Hemos tenido "apuntar y hacer clic" y "tocar y deslizar", y ahora estamos en la era de "escribir y decir". Esta democratización del acceso a productos sofisticados transformará los productos y los usuarios por igual. Después de todo, ¿cómo cambia su negocio si ahora todos sus usuarios saben cómo hacer todo en su producto? Mejor infórmese antes de que lo haga su competidor.

Aleta lanzamiento CTA horizontal