介紹 Fin:Intercom 的突破性 AI 聊天機器人,基於 GPT-4
已發表: 2023-03-15OpenAI 的 ChatGPT 的出現改變了一切——對客戶服務的巨大影響立即顯而易見。
我們迅速為我們的收件箱推出了一系列人工智能功能,應用這項技術來提高效率。 但我們被問到的第一件事是“ChatGPT 可以回答我的客戶問題嗎?” 很明顯,它比我們以前見過的任何東西都更能理解自然語言。
不幸的是,我們最初的探索表明幻覺是一個太大的問題。 為 ChatGPT 提供支持的 GPT-3.5 在不知道答案時太容易編造問題了。
但最近發布的 GPT-4 改變了一切——這個模型旨在減少幻覺。 我們很高興分享我們在早期測試中使用 GPT-4 構建的內容。
介紹我們的新 AI 聊天機器人:Fin
今天,我們宣布我們已經構建了一個人工智能支持的客戶服務機器人,它具有這項新技術的優勢,並且適合業務需求。 它叫做 Fin,我們相信它有能力成為您支持團隊的重要合作夥伴。
當我們開始嘗試構建一個由 GPT 驅動的聊天機器人時,我們心中有許多設計目標。 我們想構建一個可以:
- 使用 GPT 技術自然地交談。
- 使用您控制的信息回答有關您的業務的問題。
- 將幻覺和不准確的反應減少到可接受的水平。
- 需要最少的配置和設置。
我們相信我們已經實現了這一點。 我們新的 AI 聊天機器人“開箱即用”,可立即減少您的支持量和解決時間。
它可以比現有機器人更自然地就支持查詢進行對話——將現代人工智能的自然對話能力帶到客戶服務中。
它可以理解跨越多個對話輪次的查詢,允許您的客戶提出後續問題,並獲得額外的說明。
Fin 與客戶進行自然對話
我們擴展了 GPT-4,增加了專門為提供客戶支持而量身定制的功能和保護措施,其中信任和可靠性至關重要。
Fin 拒絕回答域外問題
Fin 旨在僅根據您現有幫助中心的內容提供答案,從而提高準確性和可信度。 為了加強這種信任感,它始終鏈接到其源文章,因此您的客戶可以驗證響應。
正如我們將在下面討論的那樣,它並不完美,但我們相信它現在已經為許多企業做好了準備。
Fin 幾乎不需要初始設置時間。 它從您現有的 Intercom 或 Zendesk 幫助中心獲取信息——利用 AI 的力量立即解釋複雜的客戶問題,並應用您的幫助中心知識來回答這些問題。
不可避免地,聊天機器人將無法回答所有客戶查詢。 在這些情況下,它可以無縫地將更難的問題傳遞給人類支持團隊。 它作為客戶服務團隊的一部分有效地工作,使用 Intercom 支持的所有工作流程。
如果 Fin 無法回答問題,它可以無縫地傳遞給 CS 代表,後者可以
我們如何構建這個 AI 聊天機器人
為了創建 Fin,我們將 Resolution Bot 背後的現有技術與 OpenAI 的新 GPT-4 相結合。
我們在四年前推出了 Resolution Bot,它在設置時運行良好,但它需要手動管理“答案”或“意圖”。 不幸的是,我們知道一些客戶難以克服這個最初的障礙。
“我們將 Fin 設計為使用您幫助中心中已有的知識來運行”
對於我們的新機器人,我們希望減少這種摩擦。
因此,我們將其設計為使用已經為您的幫助中心創建的知識來運行。 它將使用您的幫助中心文章,並使用這些信息直接回答客戶的問題。
當被問及一個問題時,聊天機器人將使用其 AI 自動將文章中的信息改寫為聽起來自然的答案。 而且,當您更新文章時,機器人的回复幾乎會立即更新。 這意味著您只需在一個地方維護您的幫助內容,並且可以自動為客戶提供最新版本。
這為企業提供了一種方法,可以以安全且可預測的方式實際利用現代人工智能的優勢,並利用其現有流程來創建幫助中心內容。
未來,我們計劃更進一步,整合我們的其他機器學習技術,幫助 AI 機器人使用您擁有的有關客戶的第一方數據來回答問題。
製作值得信賴的聊天機器人
我們將此聊天機器人設計為僅使用您已經創建的幫助內容來回答問題,以避免出現不准確或意外響應的風險。 這使您可以高度控制 Fin 可以說的內容。

“其他一些 GPT 機器人的答案基於來自網絡的大量信息,但實際上限制機器人可以使用的信息從根本上提高了它的可預測性和可信度”
如果有人問您的幫助中心未涵蓋的問題,它會說不知道答案。 這是一個重要的特徵。 其他一些 GPT 機器人的答案基於來自網絡的大量信息,但實際上限制機器人可以使用的信息從根本上提高了它的可預測性和可信度。
考慮到可信賴性,我們通過為 Fin 設計一個新的用戶界面進一步減少了不准確性——它在給出答案時清楚地鏈接到源文章,這讓用戶可以驗證源是否相關,從而減少小錯誤的影響。
Fin 將始終為其響應提供來源,允許客戶驗證其答案
我們還採取措施降低用戶讓機器人就幫助中心未包含的任何主題進行對話的能力。
限制
準確性
最終用戶可能會故意繞過我們設計的約束條件,讓 AI 聊天機器人說出不恰當的話。 如果確實發生這種情況,我們相信這只會在經過堅決的嘗試之後發生,而不是在與客戶的自然互動中發生。
我們必須指出,人工智能並不完美。 對於某些客戶來說,傳遞不相關或不正確信息的任何風險都是不可接受的。 他們可能還不想採用這種由人工智能驅動的聊天機器人。
大型語言模型目前具有與我們之前構建的機器人不同的故障模式,例如 Resolution Bot。 雖然 Resolution Bot 有時可能會提供不相關的答案,但我們的 AI 機器人有時可能會提供錯誤的答案。 例如,它可能會對文章的內容感到困惑,並向用戶做出不真實的陳述。 雖然最近的模型大大減少了這種機會,但它並非為零。
為了使您能夠量化此限制,我們正在構建一種體驗,您可以在其中將現有的幫助中心導入機器人並手動測試它。
“我們相信這些模型會繼續改進,準確性也會因此提高”
總的來說,隨著最近對 GPT-4 的改進和我們建立的設計約束,我們相信它的性能高於許多企業要求的準確度標準。
展望未來,我們相信這些模型將繼續改進,準確性也會因此提高。 我們還相信,隨著時間的推移,用戶對這項技術的局限性的理解將會加深; 我們的 AI 機器人響應被清楚地標記為“AI”以實現這一點。
最後,我們相信不同的業務在這方面自然會有不同的權衡。 就此而言,我們正在構建配置設置,允許企業設置他們想要做出的權衡,如本設計原型所示。
我們正在探索配置設置來控制 Fin 的創造力水平
GPT模型的成本
重要的是要注意,用於為該聊天機器人提供支持的大型語言模型目前的運行成本很高。 這是一項需要大量計算能力的尖端技術。 但是,我們相信這筆費用可能會隨著時間的推移而減少。
我們相信,對於許多企業而言,與讓支持代表回答相同問題相比,實施我們的 AI 聊天機器人將帶來積極的投資回報率。
潛伏
最後,GPT-4 等高級大型語言模型具有固有的延遲。 這可以在與機器人交互時看到——10 秒或更長時間的延遲並不少見。 我們還希望這會隨著時間的推移而改善。
Fin 多久可以使用?
我們已經構建了 Fin 的初始版本,到目前為止我們一直在使用它進行內部測試,並將很快推出有限測試版。 目前,我們的主要製約因素是成本和定價。
我們還在繼續基於測試迭代打磨用戶體驗,迭代Fin和Resolution Bot的集成。 我們相信高級客戶將繼續使用 Resolution Bot 和類似技術,尤其是在必須採取行動以完全解決用戶查詢的情況下——例如取消訂單。
“在 Intercom,我們長期以來一直致力於打造一個無需人工支持即可成功解決大多數客戶對話的未來”
我們希望在未來幾周和幾個月內快速完成測試過程。 作為參考,我們在 1 月底宣布的基於 GPT 的 Inbox AI 功能現在可供我們所有的客戶使用,並且已經有成千上萬的客戶在使用。
註冊客戶服務的未來
在 Intercom,我們長期以來一直致力於打造一個未來,在這個未來,大多數客戶對話都可以在不需要人工支持的情況下成功解決,從而使您的團隊騰出時間來處理更高價值的客戶對話。
我們相信今天的公告標誌著客戶服務領域的範式轉變——未來正在發生。
您可以了解更多關於新的人工智能機器人的信息,並在此處註冊候補名單。