Interface utilisateur alimentée par l'IA (alias "Return of the Chat")
Publié: 2023-08-11La révolution de l'IA est plus grande que le mobile, plus grande que le cloud, et certains chez Intercom disent encore plus grand qu'Internet lui-même.
De nombreuses projections sont basées sur la façon dont les nouvelles fonctionnalités rendront le logiciel beaucoup plus puissant : la capacité de rendre des images à partir de descriptions, d'écouter/lire longuement et de résumer en quelques secondes, de diagnostiquer les problèmes, de catégoriser les sujets et de prendre des mesures, le tout à la vitesse de la pensée. Tout ce nouveau pouvoir changera les produits logiciels de manière considérable, et nous en voyons déjà des aperçus. Un autre changement substantiel que j'attends est l'émergence de l'interface utilisateur de chat (alias interface en langage naturel) en tant qu'interface standard pour les produits.
L'essai épique / diatribe de Neal Stephenson "Au commencement était la ligne de commande" (à juste titre) a soutenu que les lignes de commande sont plus efficaces et efficientes que les interfaces pointer-cliquer (ou toucher et balayer). Ce qu'ils ne sont pas, cependant, est intuitif ou accessible à plus d'un petit pourcentage du monde (à moins que vous n'ayez deviné que redimensionner les images n'est qu'une simple find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \;
loin.)
La ligne de commande est un grand nombre de commandes obscures avec des noms idiots et des syntaxes complexes, mais le chat propulsé par LLM est beaucoup plus indulgent. Il existe une douzaine de façons différentes de dire que vous voulez une image redimensionnée, et les LLM comprendront chacune d'entre elles.
Si vous prenez ce même argument pour l'interface utilisateur, vous trouverez une certaine similitude. Par exemple, voici Workday, un produit d'une valeur de 60 milliards de dollars. Je l'utilise à contrecœur pour demander un congé, quand je me souviens comment me connecter. C'est sûr que c'est plus simple que la ligne de commande, mais c'est toujours une série d'étapes pour trouver le bon formulaire et le remplir.
Maintenant, demandez-vous, qu'est-ce qui est plus facile, en tapant "des veut le 14 octobre pour l'anniversaire de mariage" ou en naviguant dans l'interface utilisateur ci-dessus avec ses onglets sans fin, ses boutons fantômes et ses menus déroulants ? Pour les points bonus, demandez-vous si vous pourriez jamais concevoir une interface utilisateur générale qui serait plus rapide que moi en tapant simplement "des veut le 14 octobre pour l'anniversaire de mariage". Ce n'est pas facile… En fait, nous avons déjà vu émerger un gros appétit pour les interfaces clavier, et c'était avant qu'elles ne soient aussi intuitives. Autrement dit, combien de temps avant que Workday n'ajoute (au moins) ce type d'interface utilisateur ?
(D'accord, je vous entends, oui, cela pourrait prendre des années.)
Nous avons commencé avec des fruits IA à portée de main
Aujourd'hui, nous voyons des chatbots IA prospérer dans des domaines où nous nous attendions déjà à une interaction avec une zone de texte, par exemple les moteurs de recherche, la rédaction d'articles, les messagers du support client (salut Fin !) Mais cela ne s'arrêtera pas là, ce ne sont que les plus simples et la plupart des cas d'utilisation compatibles avec la radio pour l'IA. En tant que designers, nous ne sommes peut-être pas prêts à accepter que la plupart de nos travaux soient distillés en un rectangle arrondi, même avec une jolie typographie.
Mais nous allons voir des produits de transformation de l'interface utilisateur de chat auparavant limités par leurs interfaces utilisateur, leurs langages ou leurs commandes nécessairement complexes. Comme exemple pertinent, disons que vous êtes dans Excel et que vous souhaitez mettre en évidence toutes les cellules négatives en rouge - comment faites-vous cela ? La plupart d'entre nous allons sur Google, puis souvenez-vous que le mot que nous recherchons est formatage conditionnel , puis nous re-google "formatage conditionnel Excel" et ensuite la boîte de réponse Google explique quoi faire, donc nous revenons à Excel et nous suivons ces instructions de manière robotique . Ensuite, nous mémorisons instantanément toutes les connaissances temporairement acquises en cours de route et revenons à ce que nous essayons de faire en premier lieu.
Aujourd'hui, vous pouvez simplement demander à un bot de le faire pour vous. L'interface utilisateur de chat peut conduire à une énorme démocratisation de l'accès aux logiciels.

Les logiciels complexes s'améliorent avec l'interface utilisateur de chat
La plupart des utilisateurs de produits d'entreprise sont des novices perpétuels - ils en savent juste assez pour effectuer la ou les deux tâches dont ils ont le plus souvent besoin, mais au-delà de cela, ils se contenteront de pirater et de supprimer leur chemin vers un résultat. Ils ont de nombreuses notions sur les tâches qu'ils aimeraient accomplir, mais ils ne savent tout simplement pas comment. Cet obstacle en amont se propage en aval et avant que vous ne vous en rendiez compte, vous renoncez simplement à penser que le produit est bon ou peut résoudre leurs problèmes. Si vous avez déjà perdu un client au profit d'un concurrent à cause d'une fonctionnalité que vous avez déjà, vous avez connu cette douleur.
Pensez à Google Analytics, à Salesforce ou à des produits de leur puissance et de leur complexité. Vous savez, enfouie quelque part là-bas, se trouve la bonne réponse à une question importante telle que " Où obtenons-nous nos sources de trafic les plus performantes et quelle est la nouvelle source la plus récente ?" , ou " quels concurrents voyons-nous augmenter dans les transactions ?" , mais il n'y a aucune chance que vous puissiez le découvrir par vous-même. Donc, soit vous demandez à votre expert local, soit vous inventez la réponse et espérez que personne ne le découvre.
Apprendre l'interface utilisateur, même si elle est belle et élégante, vaut rarement votre temps.
Mais , si vous pouvez simplement taper (ou dire) la chose que vous essayez de faire et la regarder se produire, les barrières s'estompent. Tout le monde acquiert l'expertise, tout le monde devient des utilisateurs expérimentés, et soudain le produit change la donne. Voici une façon ridiculement simple de le visualiser :
Dans tous ces produits, il y a des utilisateurs qui savent ce qu'ils veulent faire mais ne savent pas comment le faire. L'interface utilisateur en langage naturel réduit cet écart à près de zéro.
Interfaces utilisateur de chat en version anticipée
Nous voyons déjà quelques exemples de cette approche dans la nature.
- Equals : Construit par deux anciens Intercomrades, Equals est une feuille de calcul de nouvelle génération avec des connexions en direct à des données en direct. (Avis de non-responsabilité/divulgation : je suis un investisseur.) Il vous permet de taper ce que vous essayez de faire et Equals fonctionnera et générera les commandes Excel que vous ne connaissiez pas et que vous n'allez pas pouvoir résoudre vous-même .
- Mixpanel : La société d'analyse d'événements a récemment annoncé Spark, une interface de chat IA générative qui vous permet de poser une question sur vos données, en langage clair.
- Stripe : Stripe a dévoilé une nouvelle fonctionnalité Radar permettant aux clients d'utiliser le langage naturel pour créer des règles complexes de prévention de la fraude.
Bien que je me concentre ici sur l'interface utilisateur de chat en tant que mécanisme d'entrée, il est vrai que le chat en tant que sortie est plus délicat, car à de nombreuses fins, la hiérarchisation visuelle, la hiérarchie, la conception, la mise en page, etc., sont toutes supérieures à une bulle de chat. Par exemple, des choses comme les tableaux de bord sont intrinsèquement des éléments visuels qui ne peuvent pas être remplacés par une réponse textuelle. Cependant, il peut y avoir de nombreux produits dont l'interface utilisateur s'estompe considérablement - par exemple, "Réserver des vacances le 14 octobre" → "Terminé" est une interaction parfaitement acceptable.
Je crois que c'est là que le logiciel va aller – une communication multimodale et mixte entre les gens et le logiciel. Nous avons eu « pointer et cliquer » et « taper et balayer », et maintenant nous sommes à l'ère du « taper et dire ». Cette démocratisation de l'accès aux produits sophistiqués transformera également les produits et les utilisateurs. Après tout, comment votre entreprise évolue-t-elle si tous vos utilisateurs savent désormais tout faire dans votre produit ? Mieux vaut le savoir avant votre concurrent.