设计师工具箱中的 AI:使用 ChatGPT 塑造未来

已发表: 2023-02-08

随着 GPT 的提高和大型语言模型变得更加复杂,设计思维会出现哪些新视野? 他们将如何颠覆产品设计师的传统角色?

ChatGPT 的推出引发了一阵意见和讨论的旋风,各种各样的人就它对我们意味着什么展开了激烈的交流。 现在,我们是第一个承认预测和投机性预测可能是徒劳的人,但有一点是肯定的——这些模型已经在我们思考和构建产品的方式上引起了翻天覆地的变化。

如果你在过去一周一直在收听 Inside Intercom,你就会知道我们很快就加入了 GPT 潮流,设计了新的人工智能功能,并将它们交付给 160 个测试版客户(请随时查看第一部分和第二部分如果您还没有,则进行两次对话)。 今天,在我们最新一期的 GPT 聊天中,一些实际上一直在使用 ChatGPT 和大型语言模型进行应用设计工作的人加入了我们的行列,以构建能够为客户解决实际问题的实际产品。

在这一集中,您会听到我们自己的声音:

  • Emmet Connolly,产品设计副总裁
  • Molly Mahar,机器学习团队的产品设计师
  • Gustavs Cirulis,高级首席产品设计师

他们将讨论像 ChatGPT 这样的大型语言模型 (LLM),以及它们将如何塑造未来几年产品设计师的角色。 我们不知道未来会发生什么,但如果您问我们,您能做的最好的事情就是投入其中。

以下是一些要点:

  • GPT 非常擅长总结内容、理解语言和编辑文本。 但一个主要问题是,有时它的答案听起来似是而非,但实际上是错误的。
  • 随着技术的发展,支持组织将通过培训 AI 并确保支持以人类感觉自然的对话方式完成,从被动转变为主动。
  • 可能会出现新的设计模式来管理不确定性和期望,例如在功能中建立置信度分数。
  • 随着时间的推移,企业将能够使用开源模型,并使用来自其行业或公司的专有数据,利用专业知识在此之上构建层。
  • 在未来,与 AI 的交互可能涉及对话界面、用于增强工作流程的图形界面,甚至是神经界面。
  • 设计师的角色将是创建一个 AI 界面,该界面充当智能、无威胁的同事,可以增强您的工作流程并让您的一天更轻松。

通过在 Apple 播客、Spotify、YouTube 上关注 Inside Intercom 或在您选择的播放器中获取 RSS 提要,确保您不会错过任何亮点。 以下是该剧集经过轻微编辑的文字记录。


初遇

埃米特康诺利:大家好。 欢迎来到内部对讲播客。 今天我很高兴能加入来自对讲机产品设计团队的 Molly 和 Gustavs。 自几周前推出 ChatGPT 以来,已经有很多激烈的讨论、很多随意的猜测,以及很多关于这一切意味着什么的纸上谈兵四分卫。 我想说,其中大部分来自那些根本没有直接接触过这项技术的人,这就是为什么我今天很高兴能与莫莉和古斯塔夫交谈。 因为 Molly 和 Gustavs 是全世界极少数真正使用 ChatGPT 和相关技术完成实际应用产品设计工作的两个人。 我的意思是,实际使用它来与产品集成并为客户解决实际产品问题,并让实际产品大规模运行。 那么,Molly 和 Gustavs,欢迎来到节目。 也许您想非常简短地介绍一下自己。 莫莉,你想去吗?

莫莉·马哈尔:当然,当然。 我是莫莉·马哈尔。 我是 Intercom 的一名职员设计师。 我是相当新的。 我加入了机器学习团队,有一个工程师团队,我们做了很多原型设计。

Gustavs Cirulis:嘿,我是 Gustavs。 我是首席产品设计师,我在这里的时间比 Molly 长一些。 我到处都是,但目前,我在增长团队工作。

“这让我想起了大学里的行为经济学和邓宁-克鲁格效应,你无能但过于自信”

Emmet:今天,我们将讨论 AI 和大型语言模型,例如 ChatGPT。 具体来说,关于它们对设计和设计师的意义。 我们将稍微谈谈设计师可以获得哪些新机会,特别是这项新技术,您的感受或使用 AI 与传统产品的不同之处,以及您在设计过程中遇到的一些挑战已经开始设计这些 AI 驱动的功能。 我们甚至可能在某个时候做出一些不明智的预测。 但让我们从基础开始。 莫莉,几周前当 ChatGPT 出现并引起轰动时,你的第一反应是什么? 在此之前,您已经使用 AI 和 ML 系统工作了很长一段时间。

莫莉:嗯,首先,我在 Slack 上被大量屏幕截图轰炸,并开始看到他们来自公司周围的人和 Twitter 等等。 我试了一下,感觉是,“这太酷了。 这也很聪明。” 大型语言模型 (LLM) 已经存在了一段时间,但现在他们已经在他们的 API 上放置了一个 UI。 因此,世界各地越来越多的人无需成为开发人员或其他任何人就可以使用它们,我认为这非常棒,表明人们对它们有多么兴奋。 我开始玩它,它真的很强大。

你可以问它很多问题,你可以跟进。 感觉真的很神奇。 感觉有点像谈话。 然后我们作为一个团队开始深入研究,尝试对其进行压力测试。 我觉得我开始看到炒作了。 这让我想起了大学里的行为经济学和邓宁-克鲁格效应,你无能但过于自信。 有时感觉就像那样。 这个 ChatGPT 比我更擅长胡说八道。 我很惊讶。 因此,我经历了一波关于它的感受。 我想知道快速概述 LLM 是否有用。

“法学硕士已经存在了一段时间,变得越来越好,越来越快。 ChatGPT 的神奇之处在于,作为一个人,我实际上可以使用它”

埃米特:我想是的。 我认为,对于很多人来说,ChatGPT 与每个人都在谈论的 AI 有这种联系。 那么,您介意用外行人的术语解释一下 ChatGPT 是什么,以及它与人们可能听说过的其他术语(例如大型语言模型)有何关系?

莫莉:是的,我会尽力而为。 因此,大型语言模型,简称 LLM,是在来自世界各地的大量公共文本语料库上训练的模型——我认为,有时是书籍、互联网、多模式资源。 里面有数十亿、数十亿条数据。 他们经常在整个过程中接受人类反馈的培训。 我认为这就是为什么你可以与 ChatGPT 进行对话的原因——你可以给它反馈,它实际上会回应并改变它的反应。 法学硕士已经存在了一段时间,变得越来越好,越来越快。 ChatGPT 的神奇之处在于,作为一个人,我实际上可以使用它。 其次,它实际上非常非常好。 ChatGPT 基本上是前端,我对此进行了一些简化,但它是 OpenAI 在后台拥有的大型语言模型 API 的前端。 他们有很多这样的。

还有很多其他公司也有大型语言模型。 谷歌正在研究 LaMDA,还有其他公司。 因此,我们今天可能会在这里说 ChatGPT,但我们指的是一般的技术。 我们实际上是在使用它背后的 API,而不是 ChatGPT,后者目前只能通过 UI 使用。

“以前,它只是一种,'嘿,给我写一首关于任何东西的诗'。 现在,您可以进行来回对话。 这就是人类彼此互动的方式”

埃米特:是的。 我认为 ChatGPT 的一个有趣之处在于,在某些方面,从技术角度来看,它并不是那么新鲜。 ChatGPT 是一款使用 GPT-3.5 构建的应用程序,由一家名为 OpenAI 的公司构建。 但是 GPT-3.5 已经存在了一段时间——几个月,对吧,Molly? 所以,我很好奇。 古斯塔夫,你的反应是什么? 为什么您认为我们对 ChatGPT 与底层技术的反应不同,后者已经存在了一段时间?

Gustavs:我认为最大的区别在于演示就像一场对话,你可以在其中提出后续问题并进行更深入的探讨。 以前,它只是一种,“嘿,给我写一首关于任何东西的诗。” 现在,您可以进行来回对话。 这就是人类彼此互动的方式。 所以,这比给它一个一次性的提示要熟悉得多。 当我在 ChatGPT 刚出来的时候玩它的时候,感觉就像魔法一样。 真的很难相信这是存在的。 我只是不停地玩弄它,谈论不同的话题,感觉就像有一个按需提供的私人导师,对一切都了如指掌。 它谈到了关于技术、历史、心理学甚至喜剧的各种各样的事情。 事实证明,如果你给它一个很好的提示,它真的很擅长想出单口喜剧。 这样做也很有趣。

幻觉案例

Emmet:你们俩现在已经花了几个星期的时间来处理这个问题。 我们最初的反应都非常令人印象深刻,但我们花了几周时间尝试将其应用于实际客户问题,也许还在考虑以某种方式直接应用它,它经得起炒作吗,Gustavs?

古斯塔夫斯:是的。 ChatGPT 一问世,我们就印象深刻,并意识到我们必须更好地理解它对我们业务的意义。 它似乎会对整个客户服务行业产生真正有意义的影响,因此我们成立了一个小型工作组,探索 ChatGPT 的长处、短处以及它对我们的业务可能意味着什么。 在经历了那个练习之后,我自己的恐惧和担忧以及炒作都减少了一点。 似乎技术还没有完全取代我们的工作并使一切自动化。

“模型想要取悦你,所以它想给你一个它认为你想要的答案”

事实证明,它确实擅长某些事情,但并非在所有事情上都擅长。 例如,它擅长总结内容或理解语言以及编辑和创意写作。 但是它有一个很大的幻觉缺陷,它只是编造一些听起来很真实但实际上不正确的东西,这对于客户服务解决方案来说显然是一个大问题。 您不想给出听起来似是而非但实际上不正确的答案。 但是你可以将它应用到很多有趣的事情上。 我认为最大的收获是这项技术发展得非常快。 它能给出事实正确的答案真的只是时间问题。 一旦发生这种情况,它将真正具有破坏性。

埃米特:所以,你的意思是无论如何它都会给出答案。 在某些情况下,这会导致您所谓的幻觉。 莫莉,对于任何试图真正使用它的人来说,这似乎是一个很大的限制。 什么是幻觉,它们为什么会首先发生?

莫莉:是的,正如古斯塔夫斯所说,这是一个大问题。 模型想要取悦你,所以它想给你一个它认为你想要的答案。 有时,它有可靠的信息来源,有时,它只是编造。 感觉像个孩子。 “你为什么这么做?” “嗯,我以为这就是你想要的。” 幻觉可能来自许多不同的来源。 如果你问它一个关于 Intercom 的问题,它不一定知道任何新东西。 因此,它可能会从其他地方获取一些它所知道的准确的常识,对其进行插值,并在某种程度上尝试使用常识,当然,它没有。 它并没有真正的推理能力。 它使用诸如“好吧,这可能以这种方式起作用,所以我可以就 Intercom 的 API 做出一些回答”之类的概率。 正如古斯塔夫所说,这非常有道理。 听起来很有自信。

正如你提到的,不同的公司专注于不同的事情。 有些公司更关注如何尽量减少幻觉。 而 ChatGPT,我认为,通常非常关注护栏和道德规范,并清楚它拒绝回答的内容。

Emmet:你认为我们会看到大量不同模型的激增,你可以选择最适合在绝对正确和你想要的幻觉之间进行权衡的模型,或者这是一个可能存在的问题只是随着模型变得更成熟而消失?

“ChatGPT 说明了一些有趣的事情,那就是所有这些的 UI 和 UX 都非常重要”

莫莉:我不确定它会消失。 但是,是的,已经有很多模型了。 有开源模型,并且有可能在模型之上进行我们所谓的微调。 GPT代表generative pre-trained transformer,所以它会生成东西。 它在大型语料库和变形金刚上进行了预训练。 不同的公司将专注于不同的事情。 有开源模型,而 Intercom 作为这些模型的潜在用户,可能能够在上面进行微调,以获得我们行业或公司的更多专业知识。 该技术也将更好地使用和需要更少的数据来拥有一个伟大的模型。 因此,模型将变得越来越小。 并且潜在地,在这一点上,对于一个较小的公司来说,在他们的数据上创建一个模型并且让它非常专业,知识渊博并且非常可靠可能更合理。

Emmet:让我们换个话题,更具体地谈谈设计。 显然,一般来说,GPT 和 AI 主要是一个技术故事,但我认为 ChatGPT 说明了一些有趣的事情,即所有这些的 UI 和 UX 非常重要。 例如,似乎有向对话式 UI 的转变。 你认为这是真的吗? Molly,设计在塑造我们使用这项技术所做的事情中的作用是什么?

莫莉:我的意思是,Intercom 的定位非常好。 我们的业务是关于对话和客户服务,人们对与这项技术进行对话感到非常兴奋。 但我们最近发现,至少目前,这项技术的强大功能实际上并非直接用于对话,而是与对话和语言有关。

正如我们所提到的,它非常擅长总结,并且有大量的工作流程,其中总结可以真正帮助客户服务代理。 我们最近向一些客户推出了测试版,总结是人们发现非常、非常、非常有价值的东西之一。 我们还添加了一些生成文本工具,以允许销售代表修改他们的消息,如果他们想重新措辞、使它们更友好、更正式一些,或者获得帮助来澄清事情。 这是对话的一部分,但不是直接与 ChatGPT 对话。 我们还发现它有助于生成诸如帮助中心文章之类的内容,这也是此测试版的一部分。 这在一些更隐蔽的应用程序中发挥了很大的作用,这些应用程序对于外行人来说并不那么明显,但对于销售代表来说却非常耗时。 我们可以为此提供很多价值。

“你正在寻找技术擅长的事物与风险相对较低的事物的交集。 在接下来的几个月里,我们会看到很多这样的人”

古斯塔夫斯:是的。 您可以通过多种方式使用这项技术,并通过这种方式回避我们已经看到的一些问题,特别是幻觉,它在其中编造了不正确的东西。 但它在其他方面确实很擅长。 它擅长重新措辞现有内容,并且以它为主导是有意义的,因为它可以提供明确的价值。 最终目标是完全自动化并实际给出答案。 只是技术还不够好。 但我认为我们会到达那里。

埃米特:我怀疑这将是我们在整个 2023 年看到的情况,因为我想我们会开始看到这种情况蔓延到许多不同的产品中,可能以相对简单、万无一失的方式开始,然后越来越多地把船推出去就其功能的复杂性而言。 我认为,我们所有人都怀着兴奋和可能还有一点健康的恐惧来迎接这个机会。 莫莉,你提到我们目前在测试版中有 ChatGPT 支持的这些功能。 反馈非常令人振奋和积极。 我们看到的最早迹象是真正的客户从功能中获得真正的实用性,例如在将对话交给其他人之前对其进行总结。 您正在寻找技术擅长的事物与风险相对较低的事物的交集。 在接下来的几个月里,我们会看到很多这样的情况。 所以,这将是令人兴奋的。

对话式人工智能

Emmet: Gustavs,你一直在从长远的角度考虑这个问题。 你能谈谈吗? 你提到了对讲机——我们在这里谈论这个的原因之一是,考虑到我们产品的性质,即对话式客户服务,我们可能处于非常有利的位置,以充分利用这一点。 当您考虑长期的产品和设计机会时,您怎么看?

Gustavs:在 ChatGPT 发布的早期,我们举办了这个研讨会来尝试思考未来,特别是关于如果我们有一个没有这种幻觉问题并且能够给出的模型,世界会是什么样子好的答案或说“我不知道”。 它真的很有前途,它确实增强了我们对许多我们已经相信但正在加速发展的事情的信心。 我们相信大多数支持查询将完全自动解决,无需与人工交谈。 如今,随着越来越多的“如果这样,那么那样”类型的构建器、机器人和我们自己的解析机器人,它已经在增加,它具有一些机器学习能力,但程度与 ChatGPT 不同。

“大部分支持将以对人类来说最自然的方式发生,即通过对话”

我们已经走上了这条道路,但它会加速。 因此,支持组织将开始从被动的和主要在收件箱中转变为主动的——设置和培训人工智能; 编写 AI 可以用来解决对话的内容。

我认为大多数支持将以对人类来说最自然的方式发生,即通过对话。 想象一下,如果您有一个可以随时与之交谈的人,他会为您提供个性化的答案。 这是人类最自然的互动方式。 我们今天拥有的这种搜索和浏览体验,您在 Google 上搜索某些内容并对其进行扫描以尝试快速找到内容中某处的答案,这对人类来说并不自然。 在您开始对话之前,仍然会有一些版本提供可能与您相关的内容建议。 但是当你与它互动时,它仍然可以是对话式的。

我们认为,出于多种原因,我们还需要建造一座桥梁才能到达那里。 我认为我们首先会看到通过总结或改写等方式增加支持代表。 稍后,我们将获得支持代表可以编辑和改进的回复建议,稍后,我们将进入完全自动化。 无论是技术方面还是人为方面,都需要一段时间才能习惯使用越来越多的自动化。

Emmet:你描述的是,在产品的一个非常广泛的表面区域,有很多不同的地方可以改变我们的工作方式,我们称之为队友体验和最终用户体验,在这两个方面谈话的双方。 但你也描述了我们将如何实现“我们认为技术会实现”这个模糊的未来的模糊概念。 它给我留下了深刻的印象,因为它是当今思考设计的一种非常不同的方式,并且几乎是我们思考与计算机交互的方式的深刻差异,从非常确定性、非常强硬的东西——真与假、1 和 0——到某种东西方式更模糊。

新的设计模式

Emmet:设计师现在正在考虑使用这种感觉比 CRUD 应用程序更不可知、更可塑且更不僵化的材料,我们已经习惯了“创建、写入、更新、删除”。 你发现了什么? 设计师需要如何处理他们的工作有很大的不同吗? 您是否发现某些事情很困难或具有挑战性? 设计师需要学习新技能吗? 这对于设计行为来说有多大的变化,事实上我们设计的材料几乎已经融入了这种不可知的元素?

“随着时间的推移,我们会看到越来越多的新设计模式出现,以解决如何管理这种不确定性和各方面的期望”

莫莉:我认为我们的工作仍有很多内容将保持不变。 我们正在寻找问题,挖掘人们的工作流程,寻找模式。 一件大事是需要为更多的失败案例进行设计,因为不一定有护栏。 当您进行对话时,它可能会以多种不同的方式偏离轨道。 像这样的系统也是如此。 人类作为一个物种,并不擅长概率。 当我们查看天气预报并发现下雨的可能性为 40% 时,我们并不清楚这意味着什么。

埃米特:是的,如果不下雨你会很失望,因为你被告知会下雨。

莫莉:是的。 我在荷兰——当我看到任何下雨的机会时,我就像,“会下雨的。 只是多长时间的问题。” 这就是百分比对我的意义。 但我们并不擅长解释它们。 我认为,当我们看到这些预测的可信度时,这肯定会有所作为,因为它们是对接下来应该出现的词的预测。 我们会在这方面做得更好。 有很多关于这项技术移动和变化的速度的处理,我认为这不会改变。 有很多原型设计和反应以及对延迟的思考。 现在的延迟可能会很长——为此而设计。 而且还有很多意想不到的结果。 这些是我一直注意到的一些事情。

Gustavs:我认为,随着时间的推移,我们会看到越来越多的新设计模式出现,以解决如何管理这种不确定性和各方面的期望。 目前,每个人都在试验,看看什么是有效的。 我们已经看到一些模式出现了,这些模式带有关于如何更改文本的小的预定义提示,例如“展开”、“总结”、“使其更友好”。 这是一种开始出现的相对较新的模式,我认为我们会看到越来越多的此类模式。 即使是这种交互,如果您要求 ChatGPT 生成内容,它也会有缓慢移动的光标。 这也是一个有趣的设计模式。 这在技术上是必需的,但它可以很好地设定“嘿,这是 AI 即时生成内容”的期望。

“在这些可能非常自动化的新系统中,我们是否正在考虑增加一些摩擦,以便我们保留我们认为有价值和我们想要拥有的技能?”

埃米特:所以,你是说这种逐字逐句的打字效果,明确地说,是一种技术如何逐字逐句组合的功能,可以成为同义词和视觉名片. 也许这会发生,也许不会,但是当我们看到这些转变和新技术出现时往往会出现的事情类型可能很有趣,以深入研究新设计模式出现的想法,因为当新技术出现时我们确实看到了这一点沿着。 Molly,你有没有遇到过其他人,无论是在非常低的交互设计水平上,还是在如何将其缝合到产品中的高水平上?

莫莉:我认为还有其他一些事情会开始出现得更多。 例如,当我们尝试开发一项功能时,工程师会进行回溯测试。 例如,他们使用过去的数据并据此做出预测,然后将其与队友实际所说的进行比较。 对于这样的事情,我们可能需要开始启动的不是最终用户,而是团队成员或管理员,管理 CS 组织的人可能希望拥有我称之为暗启动的东西——他们没有实时的东西,但是能够看着他们并有一种感觉,“好吧,我现在相信这会过去。” 暗启动的不同阶段、建议草案以及启动其中一些工具的不同阶段。 我认为这会更加突出。

我不知道它会朝哪个方向发展,但我考虑了一些我们可能不得不在系统中增加摩擦的地方,这样我们就不会自满。 飞行员仍然会完成飞行的某些部分,尽管大部分是由自动驾驶系统完成的,因为他们需要不要忘记如何飞行。 所以,他们正在做着陆或其他事情。 在这些可能非常自动化的新系统中,我们是否正在考虑增加一些摩擦,以便我们保留我们认为有价值和我们想要拥有的技能?

Emmet:很明显,几乎所有东西都对你必须设计的内置功能有一个隐含的置信度分数。 这是我们要向销售代表和管理员或他们的客户公开的内容吗? 我们向他们的客户展示东西的门槛更高,甚至在细节层次上也更低。 以总结长时间对话的能力为例。 你是点击一个按钮就把总结直接发布到对话线程中,还是让别人有机会审查和批准它? 让它直接通过还是增加审批门? 我认为我们可能会看到许多工作流程出现,至少在最初是这样,然后,随着技术建立越来越大的信心,它们是否会开始下降?

莫莉:是的,没错。

Gustavs:甚至只是能够告诉你它有多自信。 如果 AI 可以告诉您,“嘿,这是我的答案,它的正确率为 40%”,您可能会在发送之前将其提交给人类以供批准。 如果它有 90% 的信心,您可以继续并直接发送它,并在最终用户端有一个“嘿,这是不正确的”按钮。 这实际上取决于技术如何发展。 设计将不得不随之发展。

埃米特:是的。 上帝,请赐予我大型语言模型的信心,因为它绝对自信地说出完全错误和完全正确,而不区分它们。 这就是信任。 目前,没有任何内容表明“我对这份声明有 100% 的信心。” 至少在 ChatGPT 中。 在其他一些语言模型中,我相信我们开始看到引用的来源,这似乎是积极的一步。

在上面添加图层

埃米特:似乎有很多未知的事情,很多细节,像这样的深度设计决策需要参与进来。让我们来看看这些大趋势对设计和产品意味着什么。 人们目睹或参与了重大新技术的到来。 我正在考虑诸如云之类的事情,或者大规模转向 Web 和移动作为重要的支持技术,这些技术导致了这个全新的设计模式和产品世界,这在以前是不可用的。 有了云,我们看到了表单、提要和点赞,以及网络经历的所有视觉转换。

对于移动设备,您可以说很多相同的东西——从提要和汉堡菜单到下拉刷新和滑动删除,我们现在将其视为设计师工具包的一部分。 也许我们离预测时间已经很危险了,但你早期的工作经验是什么? 它是否告诉您什么类型的产品将赢或输,以及我们可能会看到哪些以前甚至不可能出现的新事物?

“我认为,将要获胜的企业将拥有某种专有数据和飞轮效应,不断收集和改进这些数据”

Gustavs:我认为,随着时间的推移,大多数企业将使用这些公开可用的大型语言模型,而不是创建自己的模型。 但为了彼此区分开来,他们可能会用专业知识在它们之上构建层。 例如,您可能拥有特定于业务的数据——对于支持工具,它可能是对有关您产品的特定问题的回答,以及您的支持代表给出的特定答案,而不是一般知识。 它可能是对特定领域的真正深入的了解,例如法律。

我认为,将要获胜的企业将拥有某种专有数据和飞轮效应,不断收集和改进这些数据。 另一件我认为很有趣的事情是看看像谷歌、苹果和微软这样的大公司是如何使用这项技术的,以及他们如何将它集成到操作系统级别。 这可能会对其他企业可以使用什么样的利基市场产生巨大影响。

“OpenAI 每天要损失数百万来运行 ChatGPT,从公关的角度或他们正在收集的任何研究数据来看,这可能是值得的,但这也意味着它不会是免费和悠闲的”

Emmet:您一开始就说大多数人会以某种方式集成这些大型语言模型。 我认为那些没能按照你所说的去做的企业,实际上找到了某种防御护城河,会发现自己基本上是 GPT 的薄包装,实际上并没有做很多其他事情。 所以,我完全同意你的看法。 如果你想想 App Store 或移动应用商店之类的东西,早期有很多玩具和手电筒之类的东西。 然后,逐渐地,它摇摇欲坠,成为像优步这样的大公司,如果我们没有这个模式,它就不会存在,还有 Instagram 和地图等等。 Molly,根据您的经验,您想添加什么?

Molly:我不完全确定每个人都会使用公共 LLM。 我有点担心它们要么对许多公司来说过于昂贵而无法使他们的商业模式发挥作用,要么一些大公司可能会将它们私有化。 所以,我不确定是否每个人都会使用公共的,或者人们是否会更多地转向开源并将他们的微调层放在上面。 我同意数据模式。 例如,在 Intercom,我们有大量的对话数据,我们能够做 Apple 在操作系统级别上不一定能做的事情。 这为我们提供了一些价值。 正如您所说,我认为成功的产品将不仅仅是顶层的商品层,而是深入理解问题或工作流程并将其与他们的数据模式集成的产品。

埃米特:你还谈到了一些暂时对限制很重要的事情。 它很慢。 返回响应需要几秒钟。 会有一些产品或空间不适合。 它在计算能力方面也很昂贵,因此在金钱方面也很昂贵。 您可能比我更了解这一点,但每个请求都要花费几美分。 OpenAI 每天因运行 ChatGPT 而损失数百万美元,从公关的角度或他们正在收集的任何研究数据来看,这可能是值得的,但这也意味着它不会是免费和悠闲的。 虽然技术有一个很好的习惯,那就是随着时间的推移变得更快、更便宜,而且这可能会发生在这里,但就目前而言,存在限制应用程序的某些限制。 也许我们在实时应用程序中会更少看到它。 也许我们在 B2C 应用程序中看到的会更少,因为在 B2C 应用程序中运行这些类型的查询的规模和成本可能是巨大的。 看看那里的情况也会很有趣。

接口的未来

Emmet:我很想深入探讨设计对话,并实际思考这些生成系统以及我们将如何与它们交互。 我们指的是所有新的点击和滑动以及新平台出现时您可以做的事情。 这是我们不可避免地必须小心翼翼地进入预测世界的地方。 我们都可以在一两年后回顾这一点,并嘲笑我们错得多么离谱,但有一种有趣的感觉,也许这正在转向更多基于文本、几乎基于命令行的交互方式。 产品中的另一种微趋势是这个命令 + K 调色板,你可以通过点击快捷方式并输入你想要执行的操作来弹出它。 我们在很多产品中都看到了这一点,这有助于人们普遍认为将文本和自然语言作为一种直接的交互方式。

“我不认为我们必须选择一种方式来与 AI 交互。 这是一个非常广泛的功能,可以以不同的方式应用于不同的用例”

另一方面,如果你看看以前的趋势,尤其是我们从命令行界面经历的旅程,我们最终会在上面构建非常详细的图形用户界面。 因此,我想知道您是否愿意推测一下您对这件事的看法。 这是否预示着 21 世纪将转向更多的命令行界面? 在我们弄清楚这些东西上的图形用户界面层是什么样子之前,这是一个临时的命令行东西吗? 现在说是不是太早了?

古斯塔夫斯:嗯,我想我们会拥有所有这些。 我不认为我们必须选择一种方式来与 AI 交互。 这是一个非常广泛的功能,可以以不同的方式应用于不同的用例。 因此,例如,如果您正在寻找答案,对话将是获得答案的主要方式。 但是,如果我们谈论使用 AI 来增强工作流程,我认为我们会看到图形界面,其中包含供 AI 执行的预定义操作。 这与我们今天看到的 X 的总结、改写和整个副驾驶浪潮一样。

对于工作流程自动化,我的意思是使用 AI 来改进您的工作方式。 因此,例如,在客户支持中,当您使用 AI 来改进这些回复时,您正在给客户写回复。 再次,扩展一个点或总结直到那个点的对话。 我认为可以为这些类型的工作流增强提供图形界面。

Molly:我不擅长预测,但正如您所说,我们可能会出现某种扩散,command + K 界面或您可以执行的操作的不同选项。 这项技术的挑战之一是它可以做什么的可发现性。 您可以在此提示中键入任何内容。 “像海盗一样给我写一首莎士比亚的诗,”或者什么的。 我们将设置一些护栏,但我认为我们可能会扩大范围,然后随着事情变得更加普遍和有用,我们会缩小范围。 然后,最终,一旦我们了解了这项技术的功能,也许就可以使用更多基于文本、基于对话或完全开放的界面。

当我们习惯于与我们的系统交谈时,我也对神经接口的潜力感到兴奋。 如果我能想到它,为什么要谈论它? 我知道这还有很长的路要走,但当我在伯克利时,我的一些同事正在研究这个问题。 这真的很酷。 在很多情况下你不想说话和打字,这会打开局面。 也许在更远的将来,我们将拥有可以接受非 GUI 指令并将其转化为动作的集成系统。 我们已经看到其中一些系统可以采用自然语言查询和指令,并将它们转化为您计算机上的操作。 事实上,其中一些 LLM 也非常擅长生成代码,例如 GitHub co-pilot。 因此,那里有很多潜力。

Emmet:我怀疑文本操作将在软件领域大放异彩,因为这里有很多直接的可能性。 能够突出显示一段文本并说“让它更友好”感觉非常自然。 几乎感觉它与粗体和斜体一起属于工具调色板。 这只是一种操纵现有文本的方式。 然后,有很多方法可以更进一步,例如生成或代码生成。

我个人发现使用图像生成器的体验非常不同。 同样,我们对这些系统的很多体验都是看到结果滚动,比如 ChatGPT 的屏幕截图或 DALL-E、Midjourney 或 Stable Diffusion 创建的东西。 图像生成器的创建过程对我来说感觉很笨重,并且可能是 GUI 化的并且具有更具触觉的屏幕界面。 必须在异常艺术的短 F 停止趋势中填充提示,以尝试让它创建您想要的输出,这显然是一种黑客行为。 并且有很多不同风格的维度你想要通过某种旋钮和刻度盘和滑块来更好地服务。 我想我的预测是我们将看到今天存在的提示工程将被希望更好的东西所取代。

“人工智能就像一个超级强大的同事,可以使用你拥有的工具,你可以给他们提供纯文本反馈以帮助他们改进,这有一些有趣的地方”

只是为了完成这个想法,视频和音频是非常不同的,因为你必须坐下来很长时间来回顾结果。 你可以盯着一百张图片或浏览一些文字,但老实说,我对此的看法较少,因为我投入的时间较少。 但我想这又回到了你最终所说的,Gustavs。 这不是一个令人满意的答案,但它会在很大程度上取决于。 而且我认为这在很大程度上取决于我正在操纵的东西。 我们可能会有非常不同的用户界面,这取决于它。

Gustavs:与此同时,我认为将会有新的有趣应用来提供自然语言指令。 例如,当我们进行初步探索时,我们发现一件有趣的事情是,你训练 AI 的方式可以非常、非常相似或几乎相同,就好像 AI 是一个支持代理,你可以向他们反馈你的政策如何与客户互动或使用何种语调。 即使当你对个人对话提供反馈时,你也可以只提供纯文本,因为它理解自然语言和上下文。 我想我们也会看到这一点。 有趣的是,人工智能就像一个超级强大的同事,可以使用你拥有的工具,你可以给他们纯文本反馈来帮助他们改进。

Emmet:例如,Molly 谈到了当这些东西不仅吐出文本,而且还可以采取行动时会发生什么。 这可能是他们能力的一个全新层次。

我们从这里去哪里?

Molly:对于那些听过一些早期播客的人来说,Fergal 是机器学习的主管。 他说,他对 ML 系统的理想应该是坐在你旁边的一位聪明的同事,你可以向他发出指令,并且它会实际执行得很好。 这就是梦想。 因此,正如 Gustavs 所说,能够提供自然语言反馈正是我们管理方式的巨大变化。

“我们如何让这个聪明的、可能具有威胁性的同事成为一个让你变得更好的队友?”

埃米特:我什至想知道会有多少范围。 几年前在伦敦有一家名为 Berg 的机构,他们对早期的 AI 迭代进行了大量实验。 但他们的原则之一是“像小狗一样聪明”,因为他们不希望 AI 感到威胁或不知所措。 这就是他们在我们周围划定界限的原则。 我不喜欢把设计师塑造成摇摆不定的“你不能那样做”的类型,但也许设置这些安全界限对设计师来说也是一个重要的角色。

莫莉:我认为这些界限是有作用的。 我确实想和一只小狗一起工作,但你想和一个像小狗一样聪明的人一起工作吗? 我认为设计师的角色是:我们如何让这个聪明的、可能具有威胁性的同事,一个让你变得更好的队友,让他能够拥有这个非常棒的白板、头脑风暴会议,你可以在其中重复每一个其他? 我们如何做到这一点? 这就是我们真正可以添加这种魔力的地方——让工作日变得更好,增强工作流程,并让 AI 成为人们真正的队友。

Emmet:自动驾驶汽车可能是目前人工智能最先进的应用,尽管它还没有达到广泛的采用水平。 这些级别的自动驾驶带来的紧张感以及在您通过这些级别时不断增加的风险——如果您考虑一下,其中的一个版本可能适用于很多这些事情。

莫莉:是的,我的意思是,这正是我们已经提到的。 这是一个建议吗? 有评论吗? 有审批吗? 这只是我们的五个级别的自动驾驶汽车版本。

Gustavs:另一件有趣的事情是,随着时间的推移,随着 AI 变得更好,它不仅能够给出答案,还能代表你执行操作,类似于同事可能会做的事情,这将是一个有趣的设计挑战来计算想出一种方法,让它感觉就像有人坐在你旁边帮助你,而不是黑客劫持你的电脑并点击周围的东西。 如果你能让它与设计一起工作,它会让人感觉很神奇。 或者它可能是疯狂的可怕。 这将是一个有趣的设计挑战。

埃米特:对话方式可能是最好的方式。 与远距离交互的系统相比,它被框定为友好和对话的人的程度也将很有趣。

“制作和构思工作的性质会发生很大变化吗? 我们是否必须学习新技能,例如快速工程?”

几年前,回想起来,您可以将其视为机器人炒作周期。 实际上,Intercom 非常积极地参与试验并找出我们可以做什么。 当然,正如我们已经提到的,我们有利用这一点的产品。 诸如 Resolution Bot 和 Custom Bots 之类的东西。 但我们还发现,在那个炒作周期中,有一大堆应用程序根本不适合会话 UI。 有一个天气机器人,你会说,“实际上,我不需要机器人来询问天气情况——我有一个应用程序或一个网页可以满足这个需求。” 我们也不可避免地会在这里看到很多这样的事情发生。 可能是对话式 UI 的过度应用,但随后真正有用的用例脱颖而出。

我要补充的另一件事让我非常看好对话的事情是我们一直在努力解决的问题。 图灵测试并不新鲜。 但除此之外,我几年前在谷歌工作过。 有大量的搜索工作,并以让它回答诸如“埃菲尔铁塔有多高?”之类的问题而自豪。 与我们现在可用的东西相比,这似乎是超级基础的东西。 甚至像 Siri 这样的语音助手在 11 月底的一个早晨突然醒来,发现它几乎已经过时了。

系统变得更好的速度也将真正推动其中的很大一部分。 对设计师来说,有趣的新事物之一是,与过去使用网络技术或其他任何技术相比,我们在更大程度上顺应潮流。 技术从这里走向何方将决定我们作为设计师的导演作者的愿景。

“我认为对于设计师来说,了解这一点非常重要,只是尝试和修补这些语言模型,看看如何将它们应用到您的产品中”

我在设计方面考虑的最后一个维度,特别是我们使用的工具以及它们有可能发生巨大变化的事实。 制作和构思工作的性质会发生很大变化吗? 我们是否必须学习新技能,例如快速工程? Gustavs,关于这对实际进行设计的性质的改变意味着什么有什么高层次的想法吗?

古斯塔夫斯:是的。 具体而言,就提示工程而言,我认为,随着时间的推移,我们将看到如何以与任何其他技术相同的方式做到这一点的最佳实践的出现。 显然,它们会随着时间的推移而发展并变得更好,但我认为这不会成为从根本上塑造您的业务的关键差异化因素。 很难说设计师的角色会发生怎样的变化,这取决于时间框架。 在短期内,我认为对于设计师来说,了解这一点非常重要,只是尝试和修补这些语言模型,看看如何将它们应用到您的产品中,其他企业如何将其应用到他们的产品中,以及尝试找到做新事物的模式和有趣的方法。

但从长远来看,要判断对整个行业设计师的影响要困难得多。 因此,随着人工智能变得更好,不仅在增强人类方面,而且在编写和执行任务的完全自动化方面,我认为这会从根本上颠覆许多产品和行业,甚至颠覆设计师在塑造这些产品中所扮演的角色。 我想我们会看到的。 很多悬而未决的问题,看看结果如何会很有趣。

埃米特:是的。 做我们所做的事情的好处之一是,偶尔,技术会为您提供一条全新的途径,您可以追求。 这绝对让人感觉它会极大地改变我们工作的环境,并为设计师创造大量新的挑战和机遇。 对于我们在 Intercom 的人来说,一路走好并完全致力于这条道路是非常令人兴奋的。 毫无疑问,对于 AI 和使用 AI 进行设计来说,这将是有趣的一年。 我期待着看到我们的进展。 也许我们可以就此打住。 莫莉,非常感谢你。 古斯塔夫,感谢一百万。 很高兴与您聊天并从您以前使用该技术的经验中学习。 也许当我们都变老变聪明时,我们会再做一次,但现在,非常感谢。

内部对讲播客(横向) (1)