介绍 Fin:Intercom 的突破性 AI 聊天机器人,基于 GPT-4
已发表: 2023-03-15OpenAI 的 ChatGPT 的出现改变了一切——对客户服务的巨大影响立即显而易见。
我们迅速为我们的收件箱推出了一系列人工智能功能,应用这项技术来提高效率。 但我们被问到的第一件事是“ChatGPT 可以回答我的客户问题吗?” 很明显,它比我们以前见过的任何东西都更能理解自然语言。
不幸的是,我们最初的探索表明幻觉是一个太大的问题。 为 ChatGPT 提供支持的 GPT-3.5 在不知道答案时太容易编造问题了。
但最近发布的 GPT-4 改变了一切——这个模型旨在减少幻觉。 我们很高兴分享我们在早期测试中使用 GPT-4 构建的内容。
介绍我们的新 AI 聊天机器人:Fin
今天,我们宣布我们已经构建了一个人工智能支持的客户服务机器人,它具有这项新技术的优势,并且适合业务需求。 它叫做 Fin,我们相信它有能力成为您支持团队的重要合作伙伴。
当我们开始尝试构建一个由 GPT 驱动的聊天机器人时,我们心中有许多设计目标。 我们想构建一个可以:
- 使用 GPT 技术自然地交谈。
- 使用您控制的信息回答有关您的业务的问题。
- 将幻觉和不准确的反应减少到可接受的水平。
- 需要最少的配置和设置。
我们相信我们已经实现了这一点。 我们新的 AI 聊天机器人“开箱即用”,可立即减少您的支持量和解决时间。
它可以比现有机器人更自然地就支持查询进行对话——将现代人工智能的自然对话能力带到客户服务中。
它可以理解跨越多个对话轮次的查询,允许您的客户提出后续问题,并获得额外的说明。
Fin 与客户进行自然对话
我们扩展了 GPT-4,增加了专门为提供客户支持而量身定制的功能和保护措施,其中信任和可靠性至关重要。
Fin 拒绝回答域外问题
Fin 旨在仅根据您现有帮助中心的内容提供答案,从而提高准确性和可信度。 为了加强这种信任感,它始终链接到其源文章,因此您的客户可以验证响应。
正如我们将在下面讨论的那样,它并不完美,但我们相信它现在已经为许多企业做好了准备。
Fin 几乎不需要初始设置时间。 它从您现有的 Intercom 或 Zendesk 帮助中心获取信息——利用 AI 的力量立即解释复杂的客户问题,并应用您的帮助中心知识来回答这些问题。
不可避免地,聊天机器人将无法回答所有客户查询。 在这些情况下,它可以无缝地将更难的问题传递给人类支持团队。 它作为客户服务团队的一部分有效地工作,使用 Intercom 支持的所有工作流程。
如果 Fin 无法回答问题,它可以无缝地传递给 CS 代表,后者可以
我们如何构建这个 AI 聊天机器人
为了创建 Fin,我们将 Resolution Bot 背后的现有技术与 OpenAI 的新 GPT-4 相结合。
我们在四年前推出了 Resolution Bot,它在设置时运行良好,但它需要手动管理“答案”或“意图”。 不幸的是,我们知道一些客户难以克服这个最初的障碍。
“我们将 Fin 设计为使用您帮助中心中已有的知识来运行”
对于我们的新机器人,我们希望减少这种摩擦。
因此,我们将其设计为使用已经为您的帮助中心创建的知识来运行。 它将使用您的帮助中心文章,并使用这些信息直接回答客户的问题。
当被问及一个问题时,聊天机器人将使用其 AI 自动将文章中的信息改写为听起来自然的答案。 而且,当您更新文章时,机器人的回复几乎会立即更新。 这意味着您只需在一个地方维护您的帮助内容,并且可以自动为客户提供最新版本。
这为企业提供了一种方法,可以以安全且可预测的方式实际利用现代人工智能的优势,并利用其现有流程来创建帮助中心内容。
未来,我们计划更进一步,整合我们的其他机器学习技术,帮助 AI 机器人使用您拥有的有关客户的第一方数据来回答问题。
制作值得信赖的聊天机器人
我们将此聊天机器人设计为仅使用您已经创建的帮助内容来回答问题,以避免出现不准确或意外响应的风险。 这使您可以高度控制 Fin 可以说的内容。

“其他一些 GPT 机器人的答案基于来自网络的大量信息,但实际上限制机器人可以使用的信息从根本上提高了它的可预测性和可信度”
如果有人问您的帮助中心未涵盖的问题,它会说不知道答案。 这是一个重要的特征。 其他一些 GPT 机器人的答案基于来自网络的大量信息,但实际上限制机器人可以使用的信息从根本上提高了它的可预测性和可信度。
考虑到可信赖性,我们通过为 Fin 设计一个新的用户界面进一步减少了不准确性——它在给出答案时清楚地链接到源文章,这让用户可以验证源是否相关,从而减少小错误的影响。
Fin 将始终为其响应提供来源,允许客户验证其答案
我们还采取措施降低用户让机器人就帮助中心未包含的任何主题进行对话的能力。
限制
准确性
最终用户可能会故意绕过我们设计的约束条件,让 AI 聊天机器人说出不恰当的话。 如果确实发生这种情况,我们相信这只会在经过坚决的尝试之后发生,而不是在与客户的自然互动中发生。
我们必须指出,人工智能并不完美。 对于某些客户来说,传递不相关或不正确信息的任何风险都是不可接受的。 他们可能还不想采用这种由人工智能驱动的聊天机器人。
大型语言模型目前具有与我们之前构建的机器人不同的故障模式,例如 Resolution Bot。 虽然 Resolution Bot 有时可能会提供不相关的答案,但我们的 AI 机器人有时可能会提供错误的答案。 例如,它可能会对文章的内容感到困惑,并向用户做出不真实的陈述。 虽然最近的模型大大减少了这种机会,但它并非为零。
为了使您能够量化此限制,我们正在构建一种体验,您可以在其中将现有的帮助中心导入机器人并手动测试它。
“我们相信这些模型会继续改进,准确性也会因此提高”
总的来说,随着最近对 GPT-4 的改进和我们建立的设计约束,我们相信它的性能高于许多企业要求的准确度标准。
展望未来,我们相信这些模型将继续改进,准确性也会因此提高。 我们还相信,随着时间的推移,用户对这项技术的局限性的理解将会加深; 我们的 AI 机器人响应被清楚地标记为“AI”以实现这一点。
最后,我们相信不同的业务在这方面自然会有不同的权衡。 就此而言,我们正在构建配置设置,允许企业设置他们想要做出的权衡,如本设计原型所示。
我们正在探索配置设置来控制 Fin 的创造力水平
GPT模型的成本
重要的是要注意,用于为该聊天机器人提供支持的大型语言模型目前的运行成本很高。 这是一项需要大量计算能力的尖端技术。 但是,我们相信这笔费用可能会随着时间的推移而减少。
我们相信,对于许多企业而言,与让支持代表回答相同问题相比,实施我们的 AI 聊天机器人将带来积极的投资回报率。
潜伏
最后,GPT-4 等高级大型语言模型具有固有的延迟。 这可以在与机器人交互时看到——10 秒或更长时间的延迟并不少见。 我们还希望这会随着时间的推移而改善。
Fin 多久可以使用?
我们已经构建了 Fin 的初始版本,到目前为止我们一直在使用它进行内部测试,并将很快推出有限测试版。 目前,我们的主要制约因素是成本和定价。
我们还在继续基于测试迭代打磨用户体验,迭代Fin和Resolution Bot的集成。 我们相信高级客户将继续使用 Resolution Bot 和类似技术,尤其是在必须采取行动以完全解决用户查询的情况下——例如取消订单。
“在 Intercom,我们长期以来一直致力于打造一个无需人工支持即可成功解决大多数客户对话的未来”
我们希望在未来几周和几个月内快速完成测试过程。 作为参考,我们在 1 月底宣布的基于 GPT 的 Inbox AI 功能现在可供我们所有的客户使用,并且已经有成千上万的客户在使用。
注册客户服务的未来
在 Intercom,我们长期以来一直致力于打造一个未来,在这个未来,大多数客户对话都可以在不需要人工支持的情况下成功解决,从而使您的团队腾出时间来处理更高价值的客户对话。
我们相信今天的公告标志着客户服务领域的范式转变——未来正在发生。
您可以了解更多关于新的人工智能机器人的信息,并在此处注册候补名单。