会話のきっかけ: 画期的な新しい AI チャットボットについてのチャット

公開: 2023-03-15

AI の世界は急速に変化しています。Intercom では、そのペースを設定するお手伝いをしています。 本日、OpenAI の GPT-4 と Intercom 独自の機械学習技術を搭載した新しいチャットボットである Fin を紹介できることを嬉しく思います。


ほんの数週間前、Intercom の最初の GPT を利用した機能 (カスタマー サービス担当者向けのさまざまな便利なツール) を発表しました。お客様は、これらの機能がもたらすさらなる効率性を本当に楽しんでいます。

ただし、大きな目標は、顧客のクエリに直接答えることができる GPT を利用したチャットボットを作成することでした。 これを行うには、大規模な言語モデルの力を利用できる必要がありましたが、「幻覚」による欠点はありませんでした。 当初、この問題を解決するのにどれくらいの時間がかかるかわかりませんでしたが、OpenAI による GPT-4 のリリースにより、顧客の質問に高い水準で確実に回答できるチャットボットを構築したことを明らかにすることができます。 . 私たちはそれをフィンと呼んでいます。

Inside Intercom ポッドキャストの今日のエピソードでは、機械学習のディレクターである Fergal Reid と一緒に、私たちの新しい AI チャットボット、それをどのように構築したか、それが何をするか、そしてこの驚くべきブレークスルーの次のステップがどのようになるかについて話し合いました.

重要なポイントの一部を次に示します。

  • 私たちの新しい AI チャットボットは、最新の GPT テクノロジーを使用して自然に会話できます。
  • Fin は既存のヘルプ センターから情報を取り込み、その知識のみを使用して、ビジネスに関する質問への回答方法を制御できます。
  • Intercom では、サポートの未来はボットと人間の組み合わせであると考えています。 Fin はすべての顧客の質問に答えることができるわけではなく、そのような状況では、難しい質問を人間のサポート チームにシームレスに渡すことができます。
  • 幻覚を約 10 分の 1 に減らし、信頼できる知識ベースに基づいて、Fin をビジネスに関連するクエリに制限する制約を構築しました。

私たちの議論が気に入ったら、ポッドキャストの他のエピソードをチェックしてください。 Apple Podcasts、Spotify、YouTube をフォローしたり、選択したプレーヤーで RSS フィードを取得したりできます。 以下は、エピソードの軽く編集されたトランスクリプトです。


他の名前のボット

Des Traynor: Intercom ポッドキャストのエキサイティングなエピソードへようこそ。 機械学習のディレクターである Fergal Reid に再び参加してもらい、ChatGPT が開始されてからほぼ毎日のように求められてきた機能の開始について話してくれます。

「これは実際にビジネスに使用できるボットで、ChatGPT の自然言語処理機能を備えていますが、ビジネスに関する具体的な質問に答えてくれます。」

ファーガル・リード:うん、ありがとうデス。 ChatGPT が登場して以来、人々は「ねえ、それを使って私のビジネスに関するサポートの質問に答えることができますか?」というようなものでした。 そして、私たちはいつも「ああ、わかりません。 幻覚についてはよくわかりません。 しかし、今日、私たちはこの製品に本当に興奮していると発表できることに本当に興奮していると思います。 私たちは何かを構築したと考えています – これは実際には、ChatGPT の自然言語処理機能を備えたビジネスに使用できるボットであり、ビジネスに関する具体的な質問に答えます。ヘルプセンターを使用して構築したので、インターネットなどからランダムに質問に答えることはありません。 あなたはそれが言うことを制御できます。 正解率がぐんと上がりました。 ベータ版でアクセスできる OpenAI の新しい GPT-4 モデルを使用することで、精度を大幅に向上させることができました。 だから私はこれに本当に興奮しています。

Des:つまり、ChatGPT で人々が経験し、恋に落ちたものは、事実上、何でも質問できるこのボットであり、回答に優れた刺し傷を与えるということです。 あなたはあなたのビジネスのためにそれを行うことができますか?

ファーガル:はい。 並べ替え。 そのため、何も尋ねることができないように意図的に作成しました。 アイデアは、ChatGPT で見たのと同じ種類の会話理解を持つものを構築することですが、具体的にはビジネスに関する質問にのみ答えるものです. アメリカの第 22 代大統領は誰ですか? 「ねえ、私はこの特定のビジネスに関するカスタマーサポートの質問に答えるためにここにいるだけです.」

Des:かっこいい。 それで、それは実際に何を試みるべきか、何を試みるべきでないかを効果的に知っているのでしょうか?

ファーガル:ええ、まさに。 それがアイデアです。

ボットのブレークスルー

Des: 7 週間か 8 週間前に、あなたはこれをやらないと言っていました。

「すべての顧客がそれについて私たちに尋ねていました」

ファーガル: 6 週間か 7 週間前、私たちがこの技術に注目し始めたとき、最初に見たときは、「うわー、これを構築できるか?」というようなものでした。 あなたのビジネス用にChatGPTを構築できますか? それは皆の頭の片隅にありました。 すべての顧客が私たちにそれについて尋ねていました。 私たちはそれを見ていましたが、まあ、これは多くの幻覚を引き起こし、不正確な結果をもたらすでしょう. 非常に不正確な結果、完全にでっち上げの結果、「これは非常にエキサイティングなテクノロジーですが、実際にそれを制限して幻覚を十分に止めることができるかどうかはわかりません. そして、GPT、ChatGPT、GPT-3.5 で遊ぶのに多くの時間を費やしました。

「これを使い始めたとき、これはかなり良くなったと思いました。 それでも時々幻覚を起こすことがありますが、幻覚を起こすことははるかに少なく、おそらく 10 分の 1 です。」

それが何かを知らないとき、私たちはそれを知ることができませんでした。 しかし最近、OpenAI から新しい GPT-4 モデルの新しいベータ版にアクセスできるようになりました。 そして、彼らが私たちに言ったことの1つは、「ねえ、これは過去に見た他のモデルよりもはるかに少ない幻覚になるように設計されています.」 それで、ご存知のように、私たちは「うわー、それはとても面白そうですね。 それは非常にエキサイティングですね、GPT-4、それは何をするつもりですか?」 そして、これを見て、これをいくつかのテストベッドに通して、幻覚をチェックして調べるための努力を始めました。 そして、私たちがそれを使い始めたとき、うわー、これはずっと良く見えると思いました. それでも時々幻覚を起こすことがありますが、幻覚を起こすことははるかに少なく、おそらく10倍少なく、そのようなものです. そして、私たちは非常に興奮しました。 私たちは、「うわー、大丈夫、これは突然、これが何かのように感じます. これは、ボットを構築するのに十分です。これは、使用している GPT-3.5 よりも 1 世代前です。 それがどれほど信頼できるかという点で、それはずっと先に進んでいます.

Des:エキサイティングです。 テストは何をしますか? 基本的に、これらのボットがでたらめをしていることを知っているかどうかを正確に確認するために、これらのボットに実行する拷問テストはありますか?

ファーガル:つまり、それほど進んでいないということです。 解決ボットなどの前世代のモデルでは、長年にわたって構築してきた、非常によく開発された、実戦でテスト済みのテスト ベンチマークのセットがありました。 この新しいテクノロジーはすべて数か月前のものなので、それほど原則的ではありません。 しかし、私たちは多くのエッジケースを特定しましたが、それは特定のものだけです. これらの新しいモデルで見られる特定の種類の障害モードを追跡するスプレッドシートがあります。 GPT-4 が登場したとき、「よし、これを試してみよう」と思うでしょう。 記事やナレッジ ベースにまったく含まれていない質問をするとどうなるか見てみましょう。 または、似たような質問をしますが、実際にあるものと完全には同じではありません。

そしてご存知のように、GPT-3.5 と ChatGPT では、何もわからない場合は、あなたを喜ばせたい、あなたが望むものを与えたいと思っているようです。 そして、それは何かを作り上げるだけです。 そしてGPT-4では、明らかにそれを減らすために多くの作業を行っています. そして、それは私たちにとって本当に明白です。 そのため、テストを行うと、「わかりません」と言ったり、不確実性をより多く表現したりする可能性があります。 それは私たちにとって真のゲームチェンジャーでした。

「Intercom では、サポートの未来はボットと人間の組み合わせであると信じています。」

Des:ボットが知らない場合は、人間に引き渡すことができますか?

ファーガル:もちろんです。 Intercom では、サポートの未来はボットと人間の組み合わせであると考えています。 私たちは、ボットから人間のサポート担当者への適切なハンドオーバーを行う解決ボットに関する多くの経験を持っています。うまくいけば、会話の前にそのサポート担当者を得ることができます。このボットでそれを行う必要があると考えています. たとえば、誰かが払い戻しを求めている場合、常に問題が発生します。 人間に承認してもらいたいのかもしれません。 そのため、常に人間による承認パスが必要になります。 Intercom には、ワークフローに関する非常に優れたプラットフォームがあり、それを使用して、ボットがいつ、どのように引き渡すかを制御できます。 この新しいボットが、既存のボットと同じように既存のプラットフォームと統合されるようにします。

Des:そして、ボットはクエリを引き渡す際に、何らかの方法で曖昧さをなくしたり、クエリを修飾したり、おそらく要約したりすると思いますか?

Fergal:現時点では要約機能はありませんが、ボットはあいまいさを解消して顧客の反応を引き出そうとします。 私たちの既存の解決ボットは、それを少し行います。 この新しいボットは、自然言語処理がはるかに優れているため、より効果的に処理できます。 つまり、ボットが触れた質問について、担当者の処理時間が短縮される可能性があります。 ええ、それについてもかなり興奮しています。

会話の芸術

Des:私たちの Intercom On Product ポッドキャストを聞いている人なら、私がよく好んで言うことを知っているでしょう。機能を持っているだけでは、たとえ有用な新しい機能を持っていても、優れた製品を作るには十分ではありません。 どのように製品を包み込みましたか? あなたの目標は何でしたか? この GPT-4 機能に基づいて実際の製品を構築するための設計目標は何ですか?

Fergal:つまり、かなり早い段階で、私たちが目指している一連のデザイン目標が実際にあることに気付きました。 何よりもまず、ChatGPT を使用して、人々が見て非常に感銘を受けた自然言語の理解を捉えたいと考えました。 私たちは、以前にあったものを超える世代を取得したいと考えていました。 したがって、かなり複雑な質問をしたり、1 つの質問をしたりした場合は、2 番目の質問が前の質問に照らして解釈されることを理解するために、後続の質問をします。 以前のボットはそれをしませんでした。 そして、そこにいるほとんどのボットは、それをしません. それはあまりにも大変でした。 ご存知のように、会話は機械学習アルゴリズムにとって非常にトリッキーな環境です。 微妙で相互作用が多く、サポート会話のようなものがありますが、この新しい技術はそれでうまく機能しているようです. したがって、私たちの最初の目標はそれをキャプチャすることです。

「微妙で相互作用が多く、サポート会話のようなものがありますが、この新しい技術はその点でうまく機能しているようです」

Des:その例として、質問をして、「Android アプリはありますか?」と言うかもしれません。 さて、iPhoneはどうですか? 「iPhone はどうですか?」と尋ねるのが好きです。 例として、以前に「Android アプリはありますか?」で解析したことがない限り、意味がありません。 つまり、会話の連続性と文脈を理解するために物事をつなぎ合わせるということです。

ファーガル:まさに。 それで、それはより自然に流れます。 新しいボットで質問をして回答が得られたときに、それが正確に質問したものではないことに特に気付きました。 そして、それを理解し、より適切な答えを提供します。 私たちは、それが本当に画期的な技術であるかのように感じています。

Des:それはあなたに押し返し、「もっと言ってください」と言うことができますか? 質問を限定するために、追加の質問をすることはできますか? 漠然とした何かを思いついた場合、「ねえ、これはうまくいきますか?」 それを解決しようとしますか? それとも、「それ以上のものが必要です」と答えるでしょうか。

「実際に優れた製品体験を構築するために、私たちは多くの柔軟性と多くのパワーを持っているように見えますが、今必要なのはそれを制限して制御する能力です。」

ファーガル:つまり、本来、アルゴリズムはある程度のことを行いますが、この種のテクノロジーを使用すると、この非常に高度な機能が得られ、実際に私たちがやろうとしているのは、それを大幅に制限しようとすることです. 私たちは実際に、「これはすべて箱から出してすぐに実行できますが、もっと制御する必要があります」と言おうとしています。 先に触れたように、実際に優れた製品体験を構築するためには、柔軟性とパワーがたくさんあるように見えますが、今必要なのは、それを制限して制御する能力です. そのため、私たちはそのような経験を構築してきました。 質問をしたときに十分な情報がない場合は、それを明確にしようとしますが、それを制御します。

会話の各タスクを実行するテクノロジーを備えた特別な目的のアプリケーションがあるプロンプトを設計しました。 そこで、質問するよう促すプロンプトが 1 つあります。 質問を明確にするための別のもの。 もう 1 つは、質問が完全に回答されているかどうかを確認するためのものです。 この非常に強力な言語モデルから始めますが、実際にはそれをビルディング ブロックとして使用したいだけです。 私たちはそれをコントロールしたいのです。 その制御を実現するには、それぞれを個別に実行する専用モジュールに分割します。

優れた製品には大きな責任が伴います

Des:基本的なレベルでは、自然に会話できると言っています。 私の考えでは、製品としての最大の利点は、顧客の前にソリューションの最前線として安心して置くことができるということです。 防衛と言いたかったが、軍事作戦ではない。 しかし、「ほら、ほとんどの会話はここに行くよ」と言っているかのように、それをそこに置いても問題ありません。 やり取りができ、コンテキストを維持でき、曖昧さをなくすことができるという事実は、それを行うための十分な準備が整っていることを意味します。 他に何を追加しましたか? 座ってチャットするだけでなく、他に何をするのでしょうか?

Fergal:最初に言いたいのは、これをどのように展開するかという点で、さまざまな企業がおそらくさまざまなレベルの快適さを持っているということです。 一部の人々は、おそらく「私は非常に優れたヘルプ センターを持っている」と言うでしょう。私たちが構築したこのボットは、ヘルプ センターからすべての情報を引き出します。 私はそれに戻ります。 しかし、「私には本当に良いヘルプ センターがあります。 とてもよくキュレーションされています。 時間をかけて多くの記事を掲載してきましたが、ボットに対話させて、それらすべての質問に答えてもらいたいと考えています。 他の顧客は、ボットがより日和見的に入ってきて [それ自体] を辞退することを望んでいるでしょう。私たちは、人々がボットの快適さのレベルを制御できるようにするための設定の構築に取り組んでいます.

Des:ボットが飛び込む必要があるときのある種のしきい値。

「ボットを既存のすべてのワークフローと統合して、ボットがいつ入ってほしいか、さらに重要なことに、いつ離れてほしいかを制御できるようにすることで、到達したときに既存のサポートチームに引き渡すことができます。その終わり」

ファーガル:まさに。 現時点では、非常に大きなワークフロー機能を使用できます。 また、ボットを既存のすべてのワークフローと統合して、ボットがいつ入ってくるか、さらに重要なことに、ボットがいつ出るかを制御できるようにすることで、到達したときに既存のサポート チームに引き渡すことができます。その終わり。

Des:オンラインのサポート エージェントがいない場合、またはユーザーが空いている場合は、ボットに直接送信してください。 VIP のお客様で、エージェントが待機している場合は、直接エージェントに送信してください。

ファーガル:まさに。 そこで私たちがここでやろうとしているのは、この新しいテクノロジーを採用し、それを既存のプラットフォームと統合することです。既存のプラットフォームには、業界標準のボット展開と見なされるものを構築するために必要なすべての機能が備わっています。

「私たちが立てた次の主要な設計目標は、幻覚を避けることでした」

そのため、次の主要な設計目標は、幻覚を回避することでした。 幻覚を減らすことと、ボットが自然に会話することが私たちの設計目標であったことについて話しました。 しかし、私たちは、回答できる質問の種類を顧客が制御できるようにしたいと考えていました。 現在、これらのボット、この新しい AI テクノロジーにより、大規模な言語モデルにアクセスできるようになり、インターネットのテキスト全体でトレーニングされています。 そのため、そこにはすべての知識が含まれています。 そして、これを展開する 1 つの方法 (最も単純な方法) は、「インターネットに関するすべての情報を使用して、ボットに質問に答えてもらうだけです」というものです。 しかし、それに関する問題は、それが何かを知らない場合、それを補うことができるということです. または、何かを知っている場合でも、情報を持っていることがわかっている機密性の高いトピックについて顧客に話してほしくないかもしれません。 「自分のビジネスやブランドがどのように感じているかはわかりません。情報が何であれ、奇妙な Web サイトから取得したものです。 顧客とそのような会話をしたくありません。

「私たちは、大規模な言語モデルを会話型にするために多くの作業を行ってきました。 あなたが持っているヘルプセンターの記事を理解するためにそれを使用する; ただし、実際のヘルプセンターの記事に含まれる情報のみを提供するように制限し、管理し、更新、変更、編集することができます。」

そのため、大規模な言語モデルを会話型にするために多くの作業を行いました。 あなたが持っているヘルプセンターの記事を理解するためにそれを使用する; ただし、実際のヘルプセンターの記事に含まれる情報のみを提供するように制限し、管理し、更新、変更、編集することができます。 このボットを信頼できるものにすること、大規模な言語モデルを採用すること、ただし、ビジネスやビジネスのヘルプ センターに関する質問に答えるだけに限定されたボットを構築することは、私たちの主要な設計目標でした。

それは大変な作業であり、私たちはそれを非常に誇りに思っています. あなたがその会話のピースを手に入れたので、私たちは本当に良いものを手に入れたと思います. ヘルプ センターの記事から実際の回答を得るための AI モデルのインテリジェンスを取得しますが、それには制約があります。 そのため、エンドユーザーとランダムに会話を始めるつもりはありません。

これらのボット、これらのモデルは、ジェイルブレイクすれば、彼らをだましてブランド外のことや望まないことを言わせることが常に可能です。 それはおそらくまだ可能ですが、実際に機能させるには断固たるハッキングの試みが必要になるところまで来ていると感じています. 通常の会話で極端に台本から外れるだけではありません。
明確にすることが非常に重要なことの 1 つは、これらの大規模な言語モデルが確率的であるということです。 幻覚は大幅に減少し、今では多くの企業で受け入れられると考えていますが、ゼロではありません. 彼らは時々無関係な情報を提供します。 ヘルプ センターの記事を読んでも、十分に理解していないため、質問に間違った回答をすることがあります。 おそらくサポートエージェントも間違いを犯すでしょう…

Des:人間は…

ファーガル:人間も時々間違いを犯すことが知られています。 つまり、これらのボットはテクノロジーの新時代です。 以前とは異なるトレードオフがあります。 おそらく、当社の一部のお客様は、「待ちたい」のようなものになるでしょう。 これはまだ展開したくありません。 しかし、非常に多くのお客様にとって、これはしきい値を超えると考えています。そこでは、[キュレーションを行う必要はありません。設定を行う必要はありません] という利点が得られます。以前は解決ボットを使用する必要がありましたが、初日からこれをオンにするだけで、突然、ヘルプ センターにあるすべての知識、ボットがそれを持っており、ボットはそれを使って質問に答えようとすることができます。 完璧にはなりませんが、高速になります。 これは、多くの企業にとって価値のあるトレードオフになると考えています。

Des:セットアップに関して言えば、あなたが優れた知識ベースを持つ顧客である場合、そこから優れたボットになるまでにどれくらいの時間がかかりますか? どのくらいのトレーニングが必要ですか? どのくらいの構成ですか?

ファーガル:時間はほとんどありません。 基本的に研修はありません。 私たちが構築した新しいシステムを利用するだけで、既存のヘルプセンターに向けることができます. それを引っ張ってこすり、記事を提供する準備を整える必要があるのは、少しの処理時間です。

Des:分ですか? 秒?

ファーガル:私たちはまだそれに取り組んでいます。 今は数分ですが、おそらくこれが放映される頃には、それよりもずっと低くなると思います. それを非常に非常に低くするための難しいエンジニアリング上のボトルネックはありません。 そのため、私たちはそれについて非常に興奮しています。

製品概要

Des:要約すると、この製品の箇条書きを教えてください。 それについて市場に何を伝えるべきですか?

「ChatGPT で見たように、自然な方法で会話します。 2 つ目は、ビジネスとして、その内容をコントロールできることです。」

Fergal:最初に言いたいのは、ChatGPT で見たように、自然な方法で会話するということです。 2 つ目は、ビジネスとして、その内容をコントロールできることです。 話す内容をナレッジ ベースの内容に限定することができます。 3 つ目は、幻覚は以前の状態からかなり下がっているということです。 そして 4 つ目は、セットアップが非常に簡単だということです。 これを取得して、既存の知識セットを参照するだけで、たくさんのキュレーションを行う必要はありません。

Des:私たちは Intercom であるため、少なくともいくつかの資格がなければ、たわごとをチャットしたり、誇大宣伝に従事したりすることはほとんどありません。 まだ改善に取り組んでいる分野は何ですか?

ファーガル:私が最初に言うことは、精度の部分が完璧ではないということです. これは新しいタイプの技術です。 これは、新しいタイプのソフトウェア エンジニアリングのトレードオフです。 そのため、解決ボットを使用すると、解決ボットが来て無関係な回答を返すことがありますが、それが何について話しているのかをいつでも理解でき、「それはあまり関係ありません」と言うことができます。 これは少し違います。 これにより、無関係な回答が返されることもありますが、間違った回答が返されることもあります。 ナレッジ ベースの情報を誤解している可能性があります。 これの具体的な例としては、たとえば、何かが発生する可能性のある時間のリストがあり、ユーザーが [ボット] に尋ねる場合、リストが網羅的であると想定することがあります。 そのリストは常にあったと仮定するかもしれませんが、「ああ、記事のリストにはありませんでした」と推測します。 ですから、答えはノーです。そんなことはあり得ません。 このことは、今度は起こり得ません。

Des:というわけで、お支払いを返金しない場合の例を 2 つまたは 3 つの例のリストで引用したナレッジベースの記事があるかもしれません。 言語モデルはそれを読み取り、これが発生する条件が 3 つあると結論付けます。 そして、これらが完全なリストではなく単なる実証例であることを理解していないという点で、間違いを犯しています. そうですか?

ファーガル:まさに。 その一般的な知識と一般的な理解は、ここではまだ少し制限されています。 そのため、物事のリストを見て、ほぼ大丈夫だが完全には正しくないという仮定を立てることができます。 うん。 そのため、ほとんどの場合、エラーが発生した場合、そのエラーはかなり合理的に見えますが、それでも間違っています。 しかし、あなたはそれで大丈夫である必要があります。 それは制限です。 少し間違った答えが返されることもあるという考えを受け入れる必要があります。

「私たちは、既存のヘルプセンターを利用して、ボットのデモに非常に迅速にアクセスして事前購入し、自分で試して、特定のヘルプセンターでこれがどのように機能するかを理解できるこのエクスペリエンスを構築しています。」

Des:それは定量化できますか? 私の推測では、質問ごと、ナレッジ ベースごと、顧客ごと、受容性ごとに異なるからではないと思います。では、誰かが「ねえ、ボットはどれくらい良いですか?」と言ったとき、どのように答えるのが最善でしょうか?

Fergal:最善の方法は、自分のヘルプ センターでデモを試してみることです。 既存のヘルプ センターを使用して、ボットのデモに非常に迅速にアクセスして事前購入し、自分で試してみて、これが特定のヘルプ センターでどのように機能するかを理解できるように、このエクスペリエンスを構築しています。

Des:たとえば、最近の 20 回の会話、または最も一般的なサポート クエリを再生することをお勧めしますか? 個人はどのようにして十分な情報に基づいた決定を下すのでしょうか? きっと全部やってくれるから、「こんにちは? あなたはボットですか?' 「はい、私は」ということです。

Fergal:操作するだけで、精度のレベルがすぐにわかると思います。 トップ 20 の質問をする場合、人々が毎日あなたに尋ねるタイプの質問です... あなたはそれらについて調べ、説明を求めます. これのどこが良いのか、どこが限界点なのか、かなりよくわかります。 私たちにとって、これは驚くべき新製品であり、非常に興奮していますが、まだ第 1 世代です。 機械学習のすべての部分を改善していきます。 これらすべての測定ピースも、時間とともに改善していきます。

Des:以前のボットである解決ボット 1 では、それをトレーニングします。つまり、「それは間違った答えです。 言ってほしいことはここにある」など。 今回はそれをしていません。 では、それが不正確な答えを出していることに気付いた場合、またはもっとうまくできると思う場合、どうするのが最善でしょうか? より良い記事を書きますか? そのソースを見ますか?

Fergal:まだ開発が始まったばかりです。おそらく、より細かく制御できる機能を構築する予定です。 しかし今のところ、その質問に対する答えは、「ナレッジベースの記事をより明確にしてもらえますか?」です。 実際、このボットを開発していると、世界にはあいまいな知識ベースの記事がたくさんあることがわかりました。

進化

Des:今後数か月で、他にどのような分野が発展すると思いますか?

ファーガル:私たちの側でやるべきことはたくさんあります。 現時点ではバージョン 1 です。 それを改善するために、私たちはそれを顧客に公開したいと考えています。使用状況に基づいて実際のフィードバックを得たいと考えています。 私がこれまで取り組んできたどの機械学習製品でも、常に大量の反復と、時間の経過とともに大量の改善が必要です。 また、既存の解決ボットとの統合レベルを改善したいと考えています。 私たちの既存の解決ボットはそのキュレーションを必要としますが、そのキュレーションを行う場合、それは優れています. アクションを実行するなどのことができます。 これを API に接続して、誰かがパスワードの転売について尋ねていることを認識し、実際にそのパスワードのリセットをトリガーすることができます。

「私が非常に興奮している最後の部分は、この新しい AI テクノロジーを利用して、これまでよりも劇的に多くのサポート コンテンツを生成できるというアイデアです。 非常に迅速に、この新しいボットは、コンテンツがヘルプ センターにある場合、コンテンツを使用して応答できるようになります。」

この種の次世代ボットがこれらすべてのことを実行できることは、私たちにとって非常に重要です。 最初は、「ナレッジ ベースから情報を提供する質問に答えてください」という感じになります。 ゼロセットアップ初日 - それをライブに、それは素晴らしいです. しかし、最終的には、これまで行ったすべての調査でこれを確認してきましたが、次のレベルに到達したいと考えています。 その後、人々は、クエリを解決するためのアクションを実行するために既に必要なテクノロジと機能を使用する機能を求めるようになります。 そして、この次世代の言語ベースのプラットフォーム上にさらに多くのものが構築されることに興奮しています。

そして、私が非常に興奮している最後の部分は、この新しい AI テクノロジーを利用して、これまでよりも劇的に多くのサポート コンテンツを生成できるというアイデアです。 非常に迅速に、この新しいボットは、コンテンツがヘルプ センターにある場合、コンテンツを使用して応答できるようになります。 そして、それは素晴らしいことだと思います。 過去にボットやインテントをキュレートしようとして行き詰まったヘルプ センターの記事を書ける人はたくさんいます。 ですから、私たちはそれについて非常に興奮しています。 しかし、ヘルプ センターの記事コンテンツの作成を劇的に簡単にするために、ここで構築する新しいツールがあると考えています。 たとえば、サポートの会話を取り、この次世代 AI を使用してそのプロセスをブートストラップします。

Des:たぶん 2 か月前に私たちが話した 1 つのビジョンは、サポート チームが次のような質問に答えるという考えでした。 . したがって、質問がうまくいった場合、それは私たちが以前にそれを見たことがないからです. そして、一度見たら二度と見ません。 それはあなたがそれが起こっているのを見る方法ですか?

「私たちは、受信トレイのサポート担当者が会話への回答を終了するだけで、「はい、この回答をボットに入力することを承認しました。 」

ファーガル:初めて、そこへの道が見えると思います。 解決ボット 1.0 に移行したとき、私たちが常に受け取っていた機能要求は、「受信トレイにサポート担当者を入れてもいいですか?」というものでした。 彼らに質問に答えてもらい、その質問をボットに入れることはできますか?」 そして、私たちがそれを試みたときはいつでも、それはうまくいきませんでした。なぜなら、質問を設定し、意図を設計するのに十分な質問をキュレーションすることは、単に大変な作業だったからです。 業界全体で、さまざまなサポート ボットが数多く存在します。 これを成功させ、実際に機能させた人を見たことがありません。 しかし、高度な大規模言語モデルを使用することで、受信トレイのサポート担当者が会話に答えるだけで「はい、私はボットに入るためにこの回答を承認しました。

ファーガルがボットに「ねえ、デスのクレジット カード番号は?」と尋ねることはあり得ないため、人間の承認が必要です。 ボットは、「デスが参加している別の会話にあったので、その答えを知っています」のようになります。 それは受け入れられないでしょう。 プライベートな会話と永続的なサポート知識の間には、承認のステップが必要です。 しかし、これまでよりもはるかに優れた承認プロセスへの道筋が見えていると考えています。 そして、すべての問題ではないかもしれませんが、多くの問題について、一度しか答えられない世界になる可能性があります。 そこには何かクールなものがあると思います。

Des:素晴らしい。 これはエキサイティングなリリースですが、誰でも利用できますか?

Fergal:これは、OpenAI からの GPT-4 の新しいリリースにより、現在プライベート ベータに向かっているところです。

Des:エキサイティングです。 まあ、数週間様子を見てみます。

ファーガル:ええ。 エキサイティングな時代。

CTA-RB3-横型