人工智能驱动的用户界面(又名“聊天返回”)

已发表: 2023-08-11

人工智能革命比移动更大,比云更大,Intercom 中的一些人说甚至比互联网本身更大。

许多预测都是基于新功能将如何使软件变得更加强大:根据描述渲染图像的能力,长时间聆听/阅读并在几秒钟内进行总结的能力,诊断问题的能力,对主题进行分类并采取行动的能力,一切都以思想的速度进行。 所有这些新的力量都将以巨大的方式改变软件产品,我们已经看到了这一点。 我预计的另一项重大变化是聊天 UI(又名自然语言界面)作为产品标准界面的出现。

尼尔·斯蒂芬森 (Neal Stephenson) 的史诗般的文章/咆哮“最初是命令行”(正确地)认为命令行比点击(或触摸和滑动)界面更有效和高效。 然而,它们并不是直观的或对世界上一小部分人来说是可以访问的(除非您猜到调整图像大小只是一个简单的find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \;远。)

命令行是大量晦涩难懂的命令,具有愚蠢的名称和复杂的语法,但 LLM 支持的聊天要宽容得多。 有十几种不同的方式来表达你想要调整图片大小,法学硕士会理解其中的每一种。

如果您将同样的论点应用到 UI,您会发现一些相似之处。 例如,Workday,一款价值 600 亿美元的产品。 当我记得如何登录时,我不情愿地用它来请求休假。 它肯定比命令行更容易,但仍然需要一系列步骤来找到正确的表单并填写它。

现在问问自己,哪个更简单,是输入“des Want 10 月 14 日结婚周年纪念日休息”,还是浏览上面带有无尽选项卡、幽灵按钮和下拉菜单的 UI? 为了获得奖励积分,问问自己是否可以设计一个通用 UI,比我只输入“des 想要 10 月 14 日结婚周年纪念日休息”更快。 这并不容易……事实上,我们已经看到人们对键盘优先界面的巨大需求,而那是在它们变得如此直观之前。 换句话说,Workday(至少)多久才会添加这种类型的 UI?

(好吧,我听到了,是的,这可能需要好几年。)

我们从唾手可得的人工智能果实开始

今天,我们看到人工智能聊天机器人在我们已经期望与文本框交互的领域蓬勃发展,例如搜索引擎、文章写作、客户支持信使(嗨,芬!)但它不会就此止步,这些只是最简单和最简单的。最适合无线电的人工智能用例。 作为设计师,我们可能还没有准备好接受我们的大部分工作将被简化为一个圆角矩形,即使是一个具有漂亮排版的矩形。

我们将看到聊天 UI 改变了以前受其必然的硬核用户界面、语言或命令限制的产品。 举一个相关的例子,假设您在 Excel 中,想要将所有负数单元格突出显示为红色 – 您如何做到这一点? 我们大多数人都会去谷歌,然后记住我们要找的词是条件格式,然后我们重新谷歌“条件格式Excel”,然后谷歌答案框解释了要做什么,所以我们返回Excel并遵循这些指令是自动的。 然后,我们会立即记住一路上暂时获得的所有知识,然后回到我们最初想做的事情。

今天,您只需要求机器人为您做这件事即可。 聊天 UI 可以实现软件访问的巨大民主化。

复杂的软件通过聊天 UI 变得更好

大多数企业产品用户都是永远的新手——他们只知道足以完成他们最常需要的一两个任务,但除此之外,他们只会通过破解和废弃的方式来获得结果。 他们对于自己想要完成的任务有很多想法,但就是不知道如何完成。 这种上游障碍会向下游传播,在您意识到之前,您就会放弃认为该产品有任何好处或可以解决他们的问题。 如果您曾因某项功能而被竞争对手夺走客户,那么您经历过这种痛苦。

想想 Google Analytics、Salesforce 或具有其强大功能和复杂性的产品。 您知道,在某个地方深处埋藏着一个重要问题的正确答案,例如“我们从哪里获得性能最高的流量来源,以及最新的新来源是什么?” ,或者“我们看到哪些竞争对手的交易量有所增加?” ,但你不可能自己找到答案。 因此,你要么询问当地的专家,要么自己编造答案并希望没有人知道。

学习 UI,即使它很漂亮和优雅,也很少值得你花时间。

但是,如果您只需输入(或说出)您想要做的事情,然后看着它发生,障碍就会消失。 每个人都获得了专业知识,每个人都成为高级用户,突然间,该产品就改变了游戏规则。 这是一种极其简单的可视化方法:

在所有这些产品中,有些用户知道自己想做什么,但不知道如何做。 自然语言用户界面将这一差距缩小到接近于零。

早期发布的聊天 UI

我们已经在野外看到了这种方法的一些例子。

  • Equals:Equals 由两位前 Intercomrade 构建,是下一代电子表格,可实时连接到实时数据。 (免责声明/披露:我是一名投资者。)它允许您输入您想要做的事情,Equals 将计算并生成您从未知道且无法自己计算的 Excel 命令。

  • Mixpanel:这家事件分析公司最近发布了 Spark,这是一个生成式 AI 聊天界面,允许您用简单的语言提出有关数据的问题。

  • Stripe:Stripe 推出了一项新的 Radar 功能,允许客户使用自然语言创建复杂的欺诈预防规则。

虽然我在这里关注的是作为输入机制的聊天 UI,但作为输出的聊天确实更棘手,因为对于许多目的来说,视觉优先级、层次结构、设计、布局等都优于聊天气泡。 例如,仪表板之类的东西本质上是视觉项目,无法用文本响应替代。 然而,可能有许多产品的 UI 会大幅褪色 - 例如,“预订 10 月 14 日假期”→“完成”是完全可以接受的交互。

我相信这就是软件的发展方向——人与软件之间的多模式、混合方法的通信。 我们已经经历了“点击”和“点击并滑动”,现在我们正处于“打字和说”的时代。 这种获取复杂产品的民主化将平等地改变产品和用户。 毕竟,如果您的所有用户现在都知道如何在您的产品中执行所有操作,您的业务会发生怎样的变化? 最好在你的竞争对手发现之前发现。

Fin 发射 CTA 水平