デザイナーのツールボックスに含まれる AI: ChatGPT で未来を形作る
公開: 2023-02-08GPT が基準を引き上げ、大規模な言語モデルがより洗練されるにつれて、デザイン思考にどのような新しい地平が現れるでしょうか? そして、製品デザイナーの従来の役割をどのように破壊するのでしょうか?
ChatGPT の開始により、さまざまな意見や議論が巻き起こっており、ChatGPT が私たちにとって何を意味するのかについて、あらゆる種類の人々が熱烈な意見交換を行っています。 今、私たちは予測や投機的予測がばかげたことを認めた最初の人ですが、1 つ確かなことは、これらのモデルが私たちの製品の考え方と構築方法にすでに劇的な変化を引き起こしているということです.
過去 1 週間に Inside Intercom を聴いていた方なら、私たちが GPT の流行に乗って AI を活用した新しい機能を設計し、160 人のベータ版のお客様に出荷したことをご存知でしょう (パート 1 とパート 2 をお気軽にチェックしてください)。まだ行っていない場合は、会話の 2 つ)。 本日、GPT チャットの最新作として、実際に ChatGPT と大規模な言語モデルを使用して応用設計作業を行い、顧客の実際の問題を解決する実際の製品を構築している何人かの人々が参加します。
このエピソードでは、私たち自身から次のことを聞きます。
- Emmet Connolly、製品デザイン担当副社長
- 機械学習チームのスタッフ プロダクト デザイナー、Molly Mahar 氏
- Gustavs Cirulis 氏、シニア プリンシパル プロダクト デザイナー
彼らは、ChatGPT のような大規模言語モデル (LLM) について話し、今後の製品デザイナーの役割をどのように形成するかについて話します。 未来が何をもたらすかはわかりませんが、私たちに尋ねるなら、あなたができる最善のことはそれに傾倒することです.
重要なポイントの一部を次に示します。
- GPT は、コンテンツの要約、言語の理解、テキストの編集に非常に優れています。 しかし、大きな問題は、その答えがもっともらしいように聞こえても、実際には正しくない場合があることです。
- 技術が進化するにつれて、AI をトレーニングし、人間が自然に感じる会話形式でサポートが行われるようにすることで、サポート組織は事後対応型から積極型に移行します。
- 特徴に信頼スコアを組み込むなど、不確実性と期待を管理するための新しい設計パターンが出現する可能性があります。
- 時間が経つにつれて、企業はオープン ソース モデルを使用し、業界や企業の独自データを使用して専門知識を上に重ねてレイヤーを構築できるようになります。
- 将来的には、AI との対話には、会話型インターフェース、ワークフロー拡張用のグラフィカル インターフェース、さらにはニューラル インターフェースが含まれる可能性があります。
- デザイナーの役割は、あなたのワークフローを強化し、あなたの一日を楽にしてくれる知的で脅威のない同僚として機能する AI インターフェースを作成することです。
Apple Podcasts、Spotify、YouTube で Inside Intercom をフォローするか、選択したプレーヤーで RSS フィードを取得して、ハイライトを見逃さないようにしてください。 以下は、エピソードの軽く編集されたトランスクリプトです。
初対面
エメット・コノリー:みなさん、こんにちは。 Inside Intercom ポッドキャストへようこそ。 今日、Intercom 製品設計チームの Molly と Gustavs が参加することに非常に興奮しています。 数週間前に ChatGPT が開始されて以来、ChatGPT が何を意味するのかについて、多くの白熱した議論、多くの無駄なランダムな推測、および多くの安楽椅子のクォーターバッキングが行われてきました。 そのほとんどは、実際にテクノロジーを直接扱ったことのない人々によるものです。そのため、今日、モリーとグスタフと話をすることに非常に興奮しています. Molly と Gustavs は、ChatGPT と関連技術を実際に応用した製品設計作業を実際に行った、全世界のかなり小さな少数派の 2 人だからです。 つまり、実際にそれを使用して製品と統合し、実際の製品が大規模に動作する顧客の実際の製品の問題を解決します。 モリーとグスタフス、番組へようこそ。 簡単に自己紹介をしたいのかもしれません。 モリー、行きたい?
モリー・マハー:そうですね。 私はモリー・マハーです。 私はインターコムのスタッフデザイナーです。 私はかなり新しいです。 私は機械学習チームとエンジニアのチームに所属しており、多くのプロトタイピングを行っています。
Gustavs Cirules:こんにちは、Gustavs です。 私はプリンシパル プロダクト デザイナーで、モリーよりも少し長くここにいます。 私はいろいろなところにいましたが、今は成長チームに取り組んでいます。
「大学での行動経済学とダニング・クルーガー効果を思い出した。無能だが自信過剰だ」
Emmet:今日は、AI と ChatGPT のような大規模な言語モデルについてお話します。 具体的には、デザインやデザイナーにとっての意味について。 特にこの新しいテクノロジーを使用して、デザイナーが利用できる新しい機会について、あなたにとってどのようなものであったか、または AI と従来の製品を使用することの違い、およびあなたが遭遇したいくつかの課題について少しお話します。これらの AI を活用した機能の設計を開始しました。 ある時点で、不適切な予測を行うことさえあるかもしれません。 しかし、基本から始めましょう。 Molly さん、ChatGPT がシーンに登場し、ほんの数週間前に大きな反響を呼んだときの最初の反応はどうでしたか? あなたはそれ以前からかなり長い間 AI と ML システムを扱ってきました。
Molly:まず、Slack で大量のスクリーンショットが殺到し、社内や Twitter などあらゆる場所からスクリーンショットが送られてくるのを目にするようになりました。 私はそれを試してみて、「これはとてもクールだ。 これも非常に賢いです。」 大規模言語モデル (LLM) はしばらく前から存在していましたが、現在では API に UI が組み込まれています。 そのため、世界中のより多くの人々が、開発者などでなくてもそれらを使用できるようになりました。これは非常に素晴らしいことであり、人々がどれほど興奮しているかを示しています. 私はそれで遊び始めました、そしてそれは本当に強力です。
たくさんの質問をすることができ、フォローアップすることができます。 それは本当に素晴らしいと感じます。 なんか会話みたいな感じ。 それから、チームとしてそれを掘り下げ、ストレステストを試みました。 そして、誇大宣伝が見え始めたように感じました。 大学での行動経済学とダニング・クルーガー効果を思い出しました。無能なのに自信過剰です。 と、そう感じることもありました。 この ChatGPT は、私よりもはるかに優れたデタラメです。 私はそれに驚いています。 それで、私はそれについての感情の波を通り抜けました。 LLM の概要を簡単に説明することは役に立つのではないでしょうか。
「LLM はしばらく前から存在しており、ますます良くなり、より高速になっています。 ChatGPT の素晴らしいところは、個人として実際に使用できることです」
エメット:そう思います。 多くの人にとって、話題になっている AI として ChatGPT との関連性があると思います。 では、ChatGPT とは何か、それが大規模な言語モデルなどの他の用語とどのように関連しているのかを、素人の言葉で説明していただけませんか?
モリー:ええ、頑張ります。 したがって、大規模な言語モデル (LLM) は、略して、あらゆる場所 (本、インターネット、マルチモーダル ソースなど) からの公共テキストの巨大なコーパスでトレーニングされたモデルです。 内部には何十億、何十億、何十億ものデータがあります。 そして、彼らは途中で人間のフィードバックで訓練されることがよくあります。 これが ChatGPT と会話できる理由につながると思います。フィードバックを与えると、ChatGPT は実際にそれに応答し、応答を変更します。 LLM はしばらく前から存在しており、ますます良くなり、より高速になっています。 ChatGPT の素晴らしいところは、個人として実際に使用できることです。 そして第二に、それは実際には本当に、本当に良いです. ChatGPT は基本的にフロント エンドです。これを少し単純化していますが、OpenAI がバックグラウンドで持つ大規模な言語モデル API のフロント エンドです。 そして、彼らはこれらのいくつかを持っています。
大規模な言語モデルを持つ企業は他にもたくさんあります。 Google は LaMDA に取り組んでおり、他にもいくつかの企業があります。 したがって、今日ここで ChatGPT と言うかもしれませんが、このテクノロジ全般について言及しています。 現在、UI からのみ利用できる ChatGPT ではなく、実際にはその背後にある API を使用しています。
「以前は、『なんでもいいからこの詩を作ってくれ』という感じでした。 これで、前後の会話を行うことができます。 それが人間同士の関わり方です」
エメット:ええ。 そして、ChatGPT の興味深い点の 1 つは、ある意味で、技術的な観点からはそれほど新しいものではないということです。 ChatGPT は、OpenAI という会社によって構築された GPT-3.5 を使用して構築されたアプリです。 しかし、GPT-3.5 はしばらく前から存在していました。数か月ですよね、モリー? だから、私は興味があります。 グスタフ、あなたの反応はどうでしたか? ChatGPT で見られるものと、しばらくの間利用可能だった基盤となる技術に対して、異なる反応があるのはなぜだと思いますか?
Gustavs:大きな違いは、プレゼンテーションが会話のようなもので、フォローアップの質問をしたり、より深く掘り下げたりできることだと思います。 以前は、「ねえ、何でもこの詩を作ってくれ」というようなものでした。 これで、前後の会話を行うことができます。 それが人間同士の関わり方です。 そのため、1 回限りのプロンプトを表示するよりもはるかに親しみやすくなります。 ChatGPT が出たばかりの頃に遊んでいたときは、魔法のように感じました。 これが存在するとは本当に信じられませんでした。 そして、私はそれをいじり続け、さまざまなトピックについて話しました。すべてについてすべてを知っているオンデマンドの個人教師がいるような気がしました. テクノロジー、歴史、心理学、さらにはコメディまで、あらゆる種類のことについて話しました。 結局のところ、適切なプロンプトを出すと、スタンダップ コメディを思いつくのが本当に得意です。 それもできて本当に楽しかったです。
幻覚のケース
エメット:二人とも今、これに数週間取り組んでいますね。 私たち全員が非常に印象的な最初の反応を示しましたが、これを実際の顧客の問題に適用するために数週間を費やした結果、何らかの方法で直接適用することと格闘した可能性がありますが、誇大宣伝に耐えられるでしょうか?
グスタフ:ええ。 ChatGPT が登場してすぐに感銘を受け、ChatGPT が私たちのビジネスにとって何を意味するのかをよりよく理解する必要があることに気付きました。 カスタマー サービス業界全体に非常に有意義な影響を与える可能性があるように思われたため、小さなワーキング グループを結成し、ChatGPT の長所と短所、そして私たちのビジネスにとって何を意味するのかを調査しました。 そのエクササイズを行った後、私自身の恐れや心配、誇大広告は少し減りました. 私たちの仕事を奪い、すべてを自動化する技術はまだ完成していないようです。
「モデルはあなたを喜ばせたいので、あなたが望んでいると思う答えをあなたに与えたいのです。」
結局のところ、それはいくつかの点で本当に優れていますが、すべてではありません. たとえば、コンテンツの要約、言語の理解、編集、クリエイティブ ライティングなどが得意です。 しかし、それには幻覚の大きな欠陥があり、非常にリアルに聞こえるが実際には正しくないものをでっち上げているだけであり、これはカスタマー サービス ソリューションにとって明らかに大きな問題です。 もっともらしく聞こえますが、実際には間違った答えを与えたくありません。 しかし、それを適用できる興味深いことがたくさんあります。 そして、重要なことは、このテクノロジーが非常に急速に進化していることです。 そして、事実に基づいた正しい答えが得られるようになるのは時間の問題です。 そして、それが起こると、それは本当に破壊的になります。
エメット:つまり、あなたが言っているのは、何があっても答えを出すということです。 場合によっては、これが幻覚と呼ばれるものになります。 Molly、これは、これを実際に使用しようとする人にとって大きな制限の 1 つに思えます。 幻覚とは何ですか? そもそもなぜ幻覚が起こるのでしょうか?
モリー:ええ、グスタフスが言ったように、それは大きな問題です. モデルはあなたを喜ばせたいので、あなたが欲しいと思う答えをあなたに与えたいと思っています. 信頼できる情報源がある場合もあれば、でっち上げである場合もあります。 それは子供のように感じます。 "どうしてそんなことをしました?" 「まあ、それはあなたが望んでいたことだと思いました。」 幻覚は、さまざまなソースから引き出されている可能性があります。 Intercom について質問しても、必ずしも新しいことを知っているとは限りません。 したがって、他の場所から得た正確で一般的な知識であると知っているものの断片を取り入れ、それを補間し、ある意味で常識を使おうとするかもしれませんが、もちろんそれはありません. 推理能力は本当にありません。 「まあ、これはおそらくこのように機能するかもしれないので、Intercom の API について何か答えを作ることができます」などの確率を使用します。 そして、グスタフが言ったように、それは非常にもっともらしい. とても自信に満ちているように聞こえます。
おっしゃるとおり、企業によって注目している点は異なります。 幻覚を最小限に抑える方法にもう少し焦点を当てている企業があります. 一方、ChatGPT は、多くの場合、ガードレールと倫理に重点を置いており、回答を拒否していることを明確にしています。
エメット:たくさんの異なるモデルが急増し、完全に正しいこととあなたが望む幻覚との間のトレードオフの種類に最も適したモデルを選択できると思いますか? それとも、これは問題になる可能性がありますか?モデルが成熟するにつれて消えるだけですか?
「ChatGPT は、これらすべての UI と UX が非常に重要であることを示しています。」
Molly:消えるかどうかはわかりません。 しかし、はい、すでに多くのモデルがあります。 オープン ソース モデルがあり、モデルの上で微調整と呼ばれるものを実行できる可能性があります。 GPT は Generative pretrained Transformer の略で、ものを生成します。 大規模なコーパスとトランスフォーマーで事前トレーニングされています。 さまざまな企業がさまざまなことに注力しようとしています。 オープン ソース モデルがあり、これらのモデルの潜在的なユーザーである Intercom は、業界や会社に関するより専門的な知識を得るために微調整できる可能性があります。 この技術は、優れたモデルを作成するために必要なデータの使用と削減にも優れています。 そのため、モデルはどんどん小さくなっていきます。 そして、その時点で、小規模な企業が自社のデータに基づいてモデルを作成し、それを非常に専門的で、知識が豊富で、非常に信頼できるものにする方が、はるかに合理的である可能性があります。
Emmet:話は逸れますが、デザインについてより具体的に話しましょう。 明らかに、一般的に GPT と AI は主にテクノロジーの話ですが、ChatGPT は興味深いことを示していると思います。つまり、これらすべての UI と UX が非常に重要であるということです。 たとえば、会話型 UI への移行が見られる可能性があります。 それは本当だと思いますか? モリー、ここからこの技術を使って私たちが何をするかを形作る上でのデザインの役割は何ですか?
Molly:つまり、Intercom は非常に優れた位置にあります。 私たちのビジネスは会話と顧客サービスであり、人々はこの技術との会話に非常に興奮しています. しかし、最近わかったことは、少なくとも今のところ、技術には非常に多くの力があり、それは実際には直接会話ではなく、会話と言語に関するものであるということです.
前述したように、要約は優れており、要約がカスタマー サービス エージェントに実際に役立つワークフローは数多くあります。 最近、一部のお客様向けにベータ版を開始しましたが、要約は、人々が本当に、本当に、本当に価値があると感じているものの 1 つです。 また、いくつかのジェネレーティブ テキスト ツールを追加して、営業担当者がメッセージを言い換えたり、親しみやすくしたり、もう少し正式にしたり、物事を明確にする手助けをしたりしたい場合に、メッセージを変更できるようにしました。 それは会話の一部ですが、ChatGPT と直接会話しているわけではありません。 また、このベータ リリースの一部であったヘルプ センターの記事などの作成にも役立つことがわかりました。 この力の多くは、素人にはそれほど明白ではないが、営業担当者にとっては本当に時間がかかる、より隠されたアプリケーションのいくつかにあります. そして、それによって多くの価値を提供することができます。
「テクノロジーが得意とすることと、リスクが比較的低いことの交差点を探しています。 そして、今後数か月でそれらの多くが見られるでしょう。」
グスタフ:ええ。 このテクノロジーを使用する方法はたくさんあります。それによって、これまでに見られた問題の一部を回避できます。特に、正しくないものを作り上げる幻覚の問題を回避できます。 しかし、それは他のことで本当に良いです。 既存のコンテンツを言い換えるのが得意であり、明確な価値を提供できるため、それでリードすることは理にかなっています. 最終的な目標は、完全に自動化され、実際に答えを出すことです。 ただ、その技術はまだ十分ではありません。 しかし、私たちはそこにたどり着くと思います。
Emmet: 2023 年を通して、このような状況が続くのではないかと思います。なぜなら、これが多くの異なる製品に忍び込み、おそらく最初は比較的単純で誰にでもできる方法で始まり、その後ますます勢いを増していくのではないかと考えているからです。それができることの複雑さの観点から。 私たちは皆、興奮とおそらく少しの健全な恐怖を組み合わせて、この機会に近づいたと思います. モリー、あなたは、現時点ではベータ版の ChatGPT によってサポートされているこれらの機能があると言いました。 そして、フィードバックは非常に励みになり、肯定的です。 私たちが目にしている最も初期の兆候は、実際の顧客が会話を他の人に渡す前に要約するなどの機能から真の有用性を得ていることです. テクノロジーが得意とすることと、リスクが比較的低いことの交差点を探しています。 そして、今後数か月でそれらの多くが見られるでしょう。 だから、それはエキサイティングになるでしょう。
会話型 AI
Emmet: Gustavs、あなたはこれについてもっと長期的な視点で考えてきました。 それについて少し話していただけますか? Intercom について言及しましたが、これについてここで話している理由の 1 つは、会話型のカスタマー サービスである当社の製品の性質を考えると、これを最大限に活用するのにおそらくかなり有利な立場にあるからです。 長期的な製品やデザインの機会について考えるとき、どう思いますか?
Gustavs: ChatGPT の立ち上げの非常に初期の頃、私たちはこのワークショップを行い、将来について考えてみました。具体的には、この幻覚の問題がなく、与えることができるモデルがあった場合、世界はどのように見えるかについて考えました。良い答えを出すか、「わからない」と言います。 それは本当に有望であり、私たちがすでに信じていたが加速している多くのことに対する私たちの自信を本当に高めました. サポート クエリの大部分は、人間と話すことなく完全に自動的に解決されると考えています。 ボットと、機械学習機能を備えていますが、ChatGPT ほどではない独自の解決ボットを使用した、「もしこれなら、それなら」タイプのビルダーの増加により、今日すでに増加しています。
「サポートの大部分は、人間にとって最も自然な方法で、会話を通じて行われます。」
私たちはすでにその道を進んでいますが、それは加速するでしょう。 その結果、サポート組織は、主に受信トレイにある受動的なものから、積極的なものへと移行し始めます。つまり、AI のセットアップとトレーニングです。 AI が会話を解決するために使用できるコンテンツを作成します。
サポートの大部分は、人間にとって最も自然な方法で、会話を通じて行われると思います。 あなただけにパーソナライズされた答えを持っている、いつでも話すことができる誰かがいると想像してみてください. それは人間が相互作用する最も自然な方法です。 Google で何かを検索してスキャンし、コンテンツのどこかにある答えをすばやく見つけようとする今日の検索と閲覧のエクスペリエンスは、人間にとってそれほど自然ではありません。 会話を始める前に、あなたに関連する可能性のあるコンテンツの提案を含むいくつかのバージョンがまだあります. しかし、あなたがそれと対話するとき、それはまだ会話的である可能性があります.
複数の理由から、そこにたどり着くための架け橋を築く必要もあると考えています。 要約や言い換えなどによるサポート担当者の増強を確認することから始めると思います。 後で、サポート担当者が編集および改善できる返信の提案について説明し、後で完全な自動化について説明します. ますます多くの自動化を使用することに慣れるには、技術的にも人間的な側面でも、しばらく時間がかかるでしょう。
Emmet:あなたは、製品の非常に広い表面領域にわたって、私たちがチームメイト エクスペリエンスとエンド ユーザー エクスペリエンスと呼ぶものの両方で、私たちの働き方を変えることができるさまざまな場所がたくさんあることについて説明しています。会話の側面。 しかし、あなたはまた、「テクノロジーがそこに到達すると思う」という漠然とした未来にどのように到達するかについてのこの曇った概念についても説明しています. それは、今日のデザインへのアプローチについての非常に異なる考え方であり、コンピューターとのやり取りについての私たちの考え方にほとんど大きな違いがあるように私には思えます。真と偽、1 と 0 など、非常に決定論的で非常にハードエッジなものから何かへと移行します。はるかにファジーです。
新しいデザイン パターン
Emmet:デザイナーは現在、私たちが慣れ親しんできた「作成、書き込み、更新、削除」という CRUD アプリよりもはるかにわかりにくく、可塑的で、硬直性が低いこの素材の使用を検討しています。 何を見つけましたか? デザイナーが仕事に取り組む方法に大きな違いはありますか? 特定のことが難しい、または挑戦的だと感じたことはありますか? デザイナーは新しいスキルを習得する必要がありますか? これは、デザインする行為にとってどれほど大きな変化でしょうか?私たちがデザインしている素材には、ほとんど知らないという要素が組み込まれているという事実は?
「時間が経つにつれて、この不確実性と期待をあらゆる面で管理する方法について、新しいデザインパターンがますます出現するでしょう。」
Molly:私たちの仕事には、変わらないものがまだたくさんあると思います。 私たちは問題を見つけ、人々のワークフローを掘り下げ、パターンを見つけています。 必ずしもガードレールがあるとは限らないため、より多くの障害ケースに対応するように設計する必要があることが 1 つの重要な点です。 会話をしていると、さまざまな形で脱線することがあります。 そして、それはこのようなシステムでも同じです。 人間は、種として、確率に優れていません。 天気予報を見て、降水確率が 40% であっても、それが何を意味するのかよくわかりません。
Emmet:ええ、雨が降ると言われたので、雨が降らないとがっかりします。
モリー:ええ。 私はオランダにいます – 雨が降る可能性があるときは、「雨が降るでしょう。 問題は、どれくらいの期間なのかということです。」 それが私にとってパーセンテージが意味するものです。 しかし、私たちはそれらを解釈するのが得意ではありません。 これらの予測は次にどのような言葉が来るかの予測であるため、これらの予測がどれほど信頼できるかを見ると、それは間違いなく何かになると思います. そして、私たちはそれをより良くすることを目指します。 この技術の動きと変化の速さについては多くのことが議論されていますが、それは変わらないと思います。 プロトタイプを作成し、反応し、レイテンシーについて考えることがたくさんあります。 現在のレイテンシは非常に長くなる可能性があります – そのための設計. そして予想外の結果もたくさんあります。 これらは私が気づいていることのいくつかです。
Gustavs:時間の経過とともに、この不確実性と期待をあらゆる面で管理する方法について、新しい設計パターンがますます出現することになると思います。 現時点では、誰もが実験を行っており、何が機能するかを確認しています。 「これを展開する」、「これを要約する」、「より親しみやすくする」などのテキストを変更する方法について、事前に定義された小さなプロンプトを表示するパターンがいくつか出現しています。 出現し始めた比較的新しいパターンであり、このようなタイプのパターンがますます多く見られるようになると思います。 ChatGPTにコンテンツを生成するように依頼すると、カーソルがゆっくりと移動します。 これも面白いデザインパターンです。 技術的には必要ですが、「ああ、これはその場でコンテンツを生成する AI だ」という期待を設定するのに非常にうまく機能する可能性があります。
「非常に自動化されている可能性のあるこれらの新しいシステムでは、価値があると感じ、必要なスキルを維持するために、摩擦を元に戻すことを考えていますか?」
Emmet:つまり、この単語ごとのティッカーテープのタイピング効果は、明確にするために、テクノロジーが単語ごとにどのようにそれを構成するかの関数であり、同義語になり、視覚的なコーリングカードになる可能性があると言っています. それは起こるかもしれないし、起こらないかもしれないが、これらの変化や新しいテクノロジーの出現を目にしたときに出現する傾向があるものは、新しいデザインパターンの出現のアイデアをドリルダウンするのに興味深いかもしれない.平行。 モリー、インタラクションの設計レベルが非常に低いレベルで、またはこれが製品にどのように組み込まれるかという高レベルで、他に遭遇したことはありますか?
Molly:他にもいくつか出てくると思うものがあります。 たとえば、機能を開発しようとしているとき、エンジニアはバックテストを行っています。 彼らは過去のデータを使用して予測を行い、それをチームメイトが実際に言ったことと比較しています。 そのような場合、エンド ユーザーではなく、チームメイトまたは管理者側でローンチを開始する必要があるかもしれません。CS 組織を管理する人々は、私がダーク ローンチと呼んでいるものを望んでいる可能性があります。それらを見て、「わかりました、私はこれを信頼しています」という感覚を得ることができます。 ダーク ローンチのさまざまな段階、ドラフトの提案、およびこれらのツールのいくつかをローンチするさまざまな段階。 そのほうが目立つと思います。
どちらの方向に進むかはわかりませんが、自己満足に陥らないように、システムに摩擦を追加する必要があるかもしれないポイントについて考えています。 パイロットは、飛行方法を忘れないようにする必要があるため、自動操縦システムがほとんどの作業を行っていても、飛行の特定の部分を行います。 それで、彼らは上陸やその他のことをしています。 非常に自動化されている可能性があるこれらの新しいシステムでは、価値があると感じ、必要なスキルを維持するために、摩擦を元に戻すことを考えていますか?
Emmet:そして明らかに、ほとんどすべてのものには、設計しなければならない組み込み機能の暗黙の信頼スコアがあります。 これは、担当者や管理者、またはその顧客に公開するものですか? 私たちが彼らの顧客に物を公開したり、より低い詳細レベルでさえも公開するためのより高いしきい値があります. 長い会話を要約する能力を身につけてください。 ボタンをクリックするだけでその要約を会話スレッドに直接投稿しますか、それとも誰かにそれを確認して承認する機会を与えますか? 承認ゲートを追加するのではなく、そのまま通過させますか? 少なくとも最初のうちは、おそらく多くのワークフローが出現するだろうと思いますが、その後、技術がますます自信を深めるにつれて、それらは衰退し始めますか?
モリー:ええ、まさに。
グスタフ:どれだけ自信があるかを伝える能力だけでも。 AI が「これが私の答えで、正解率は 40% です」と言うことができれば、送信前に人間が承認できるように提示することができます。 90% の信頼性がある場合は、すぐに送信して、エンド ユーザー側に「これは正しくありません」というボタンを表示することができます。 それは本当に技術がどのように進化するかにかかっています。 デザインはそれに合わせて進化する必要があります。
エメット:ええ。 神よ、大規模な言語モデルの信頼を私に与えてください。なぜなら、それは完全な虚偽と完全な真実を区別せずに絶対に自信を持って言うからです. そして、それは信頼の問題です。 現時点では、「この声明に 100% 自信を持っています」と言うものは何もありません。 少なくとも ChatGPT では。 他の言語モデルのいくつかでは、ソースが参照され始めていると思いますが、これは前向きなステップのようです.
上にレイヤーを追加する
Emmet:未知のものがたくさんあるようです。このような核心的で深いデザインの決定がたくさんあります。これらのメガトレンドがデザインと製品に何を意味するのかをズームアウトしてみましょう. 人々は、大きな新しいテクノロジーの到来を目の当たりにしたり、その一部になったりしています。 私が考えているのは、クラウドや Web やモバイルへの大規模な移行など、これまで利用できなかったデザイン パターンや製品のまったく新しい世界につながった大きな実現技術です。 クラウドにより、フォーム、フィード、いいね、そして Web が経験したすべての視覚的な変化が見られました。
モバイルでも同じことが言えます。フィードやハンバーガー メニューから、プルして更新、スワイプして削除するものまで、すべてがデザイナーのツールキットの一部と見なされています。 危険なほど予測時間に近づいているのかもしれませんが、これを使った初期の経験は何ですか? どのタイプの製品が勝敗を分けるか、また、以前は不可能だった新しいものが出現する可能性があることについて、何かを教えてくれますか?
「私が思うに、勝つビジネスとは、ある種の独自データを持ち、そのデータを継続的に収集して改善するはずみ車効果を持つビジネスです。」
Gustavs:時間の経過とともに、ほとんどの企業は、独自の言語モデルを作成する代わりに、これらの公開されている大規模な言語モデルを使用するようになると思います。 しかし、お互いを差別化するために、彼らは専門的な知識でそれらの上にレイヤーを構築するかもしれません. たとえば、ビジネス固有のデータがあるとします。サポート ツールの場合、製品に関する特定の質問に対する回答であり、一般化された知識ではなく、特定の回答を提供するサポート担当者です。 それは、法律などの特定の分野に関する非常に深い知識である可能性があります。
私が思うに、勝つビジネスとは、ある種の独自データを持ち、そのデータを継続的に収集して改善するはずみ車効果を持つビジネスです。 私が興味深いと思うもう 1 つのことは、Google、Apple、Microsoft などの大企業がこのテクノロジをどのように使用し、OS レベルにどのように統合するかを見ることです。 これは、他のビジネスが利用できるニッチの種類に大きな影響を与える可能性があります。
「OpenAI は、ChatGPT を実行するために 1 日に数百万ドルを失っています。PR の観点や、彼らが収集している研究データが何であれ、それはおそらく価値がありますが、それはまた、それが無料でのんびりすることにはならないことを意味します。」
Emmet:あなたはまず、ほとんどの人がこれらの大きな言語モデルを特定の方法で統合しようとしていると言いました。 あなたが言ったことを何とか実行できず、実際にある種の防御的な壕を見つけた企業は、基本的にGPTの薄いラッパーであり、他に多くのことをしていないことに気付くでしょう. だから、私はあなたに完全に同意します。 App Store やモバイル アプリ ストアのようなものについて考えてみると、初期の頃はおもちゃや懐中電灯などがたくさんありました。 そして、徐々に、このモデルがなければ存在できなかった Uber や、Instagram や地図などのような、大きな可能性へと変化していきます。 モリー、あなたの経験に基づいて追加したいことはありますか?
Molly:誰もがパブリック LLM を使用するかどうかは完全にはわかりません。 多くの企業がビジネスモデルを機能させるには費用がかかりすぎるか、一部の大企業がそれらを非公開にする可能性があるのではないかと、私は少し心配しています。 そのため、誰もがパブリックなものを使用するようになるのか、それとも人々がオープン ソースに移行して微調整されたレイヤーを上に置くようになるのかはわかりません。 データモードについて同意します。 たとえば、Intercom には多くの会話データがあり、Apple が OS レベルで必ずしもできないことを行うことができます。 そして、それは私たちに何らかの価値を提供します。 成功する製品は、あなたが言ったように、単なるコモディティ レイヤーではなく、問題やワークフローを深く理解し、それをデータ モードと統合できる製品になると思います。
Emmet:また、当分の間、制限に関して重要になるいくつかのことにも触れました。 遅いです。 応答を返すのに数秒かかります。 不適切な製品やスペースがいくつかあるでしょう。 また、計算能力の面でも高価であり、したがって金銭面でも高価です。 あなたはおそらくこれについて私よりもよく知っていますが、すべてのリクエストには数セントの費用がかかります. OpenAI は ChatGPT を実行するために 1 日に数百万ドルを失っており、PR の観点や、彼らが収集している研究データが何であれ、おそらくそれだけの価値はありますが、それはまた、それが無料でのんびりできるものではないことを意味します. テクノロジーには、時間の経過とともに高速化と低価格化という非常に優れた習慣があり、これがここで発生する可能性がありますが、当面は、アプリケーションを制限する特定の制限があります. リアルタイム アプリではあまり見られないかもしれません。 おそらく、この種のクエリを実行する規模とコストが膨大になる可能性がある B2C アプリでは、あまり見られないでしょう。 そこからどう展開していくのか、興味深いところです。
インターフェースの未来
Emmet:私は、デザインに関する会話をより深く掘り下げて、これらの生成システムと、それらとどのように相互作用するかについて実際に考えたいと思っています。 私たちは、新しいプラットフォームが登場したときにできるすべての新しいタップとスワイプ、およびできることをほのめかしています. これは、必然的に予測の世界に足を踏み入れなければならない場所です. 1 年か 2 年後にこれを振り返って、自分がいかに間違っていたかを笑うことができますが、おそらくこれは、よりテキスト ベースの、ほぼコマンド ライン ベースの対話方法に移行しているという興味深い感覚があります。 製品のもう 1 つのマイクロ トレンドは、コマンド + K パレットで、ショートカットを押して実行したいアクションを入力することでポップアップできます。 多くの製品でそれが見られますが、これは、インターフェースの直接的な方法として、テキストと自然言語へのシフトのこの一般的な感覚に貢献しています.
「AI と対話するために 1 つの方法を選択する必要はないと思います。 これは、さまざまなユースケースにさまざまな方法で適用できる非常に幅広い機能です。」
一方、これまでの傾向、特にコマンド ライン インターフェースからたどってきた道のりを見ると、非常に詳細なグラフィカル ユーザー インターフェースを構築することになりました。 ですから、これがどこに行くのかについて推測してみてはいかがでしょうか。 これは、21 世紀に向けてより多くのコマンドライン インターフェイスへと移行する前兆でしょうか? これは、これらのグラフィカル ユーザー インターフェイス レイヤーがどのように見えるかを理解する前の一時的なコマンド ラインのことですか? 言うのはまだ早すぎますか?
Gustavs:ええと、私たちはそれらすべてを持っていると思います. AI と対話するために 1 つの方法を選択する必要はないと思います。 これは非常に幅広い機能であり、さまざまなユース ケースにさまざまな方法で適用できます。 したがって、たとえば、答えを探している場合、会話は答えを得るための主要な方法になります。 しかし、AI によるワークフローの拡張について話しているのであれば、AI が実行する事前定義されたアクションを備えたグラフィカル インターフェイスが表示されると思います。 これは、X の要約、言い換え、および副操縦士の全体の波で、今日私たちが目にしているのと同じです。
ワークフローの自動化とは、AI を使用して作業方法を改善することを意味します。 たとえば、カスタマー サポートでは、AI を使用して顧客への返信を作成し、それらの返信を改善しています。 繰り返しますが、ポイントを拡張したり、その時点までの会話を要約したりします。 このようなワークフローの拡張には、グラフィカル インターフェイスが存在する可能性があると思います。
Molly:私は予測が苦手ですが、あなたが言ったように、コマンド + K インターフェイスや、実行できるさまざまなオプションが急増する可能性があります。 この技術の課題の 1 つは、何ができるかを発見しやすくすることです。 このプロンプトには何でも入力できます。 「海賊みたいにシェイクスピアの詩を書いてくれ」とか。 いくつかのガードレールを設置する予定ですが、一般的で有用なものが増えるにつれて、おそらく幅広く行ってから、少し絞り込んでいくと思います。 そして、最終的には、この技術で何ができるかがわかれば、テキストベース、会話ベース、または広く開かれたインターフェースに移行できるかもしれません.
システムとの対話に慣れてきたので、ニューラル インターフェースの可能性にも興奮しています。 考えられるのなら、なぜそれについて話すのですか? それはまだ先のことだと思いますが、私がバークレーにいたとき、同僚の何人かがそれに取り組んでいました。 それは本当にクールだろう。 話したりタイプしたりしたくない状況がたくさんありますが、これで問題が解決します。 将来的には、GUI 以外の指示を受け取り、それをアクションに変換できる統合システムが登場するかもしれません。 自然言語のクエリと指示を受け取り、コンピューター上でアクションに変換できるこれらのシステムのいくつかで、すでにそれが見られます。 実際のところ、これらの LLM の中には、GitHub の副操縦士のようにコードを生成するのが得意なものもあります。 そして、そこには多くの可能性があります。
Emmet:テキスト操作はソフトウェアで素晴らしい年になるのではないかと思います。 テキストの一部を強調表示して、「これをより親しみやすくしてください」と言うのは非常に自然なことです。 太字や斜体と並んでツール パレットに属しているように感じます。 これは、既存のテキストを操作する方法にすぎません。 次に、生成やコード生成など、それをさらに進める方法がたくさんあります。
個人的には、イメージ ジェネレーターを使った作業の経験はまったく異なるものであることがわかりました。 繰り返しになりますが、これらのシステムに関する私たちの経験の多くは、ChatGPT のスクリーンショットや、DALL-E、Midjourney、または Stable Diffusion が作成したもののように、結果がスクロールするのを見ています。 イメージ ジェネレーターの作成プロセスは、私にはぎこちなく感じられます。おそらく、GUI 化され、はるかに触覚的な画面上のインターフェイスを備えたものになるでしょう。 プロンプトに逸脱したアートのトレンドである短い F ストップを詰め込んで、必要な出力を作成しようとするのは明らかにハックです。 そして、あなたが経験したいさまざまなスタイルの次元がたくさんありますが、それらは、ある種のノブ、ダイヤル、およびスライダーによって提供される方がはるかに優れています. 私の予測では、現在存在する迅速なエンジニアリングが、願わくばはるかに優れたものに置き換わることになるでしょう。
「AI は、あなたが持っているツールを使用できる超強力な同僚のようなものであり、それらを改善するために平文のフィードバックを与えることができるという興味深い点があります。」
最後に、長時間座って結果を確認する必要があるため、ビデオとオーディオは大きく異なります。 100 枚の画像を目で確認したり、テキストをざっと読んだりすることはできますが、それについてはあまり意見がありません。 しかし、最終的にあなたが言っていたことに戻ると思います、グスタフ。 満足のいく答えではありませんが、大きく依存します。 そして、それは私が操作しているものに大きく依存すると思います. また、それに応じて非常に異なる UI を使用する場合もあります。
Gustavs:同時に、自然言語による指示を与える新しい興味深いアプリケーションが登場すると思います。 たとえば、最初の調査を行ったときに興味深いことがわかったのは、AI をトレーニングする方法は、AI がサポート エージェントである場合と非常に似ているか、実質的に同じである可能性があり、AI に関するポリシーについてフィードバックを提供することでした。顧客とのやり取りの仕方や、使用する声のトーン。 個々の会話に関するフィードバックを提供する場合でも、自然言語とコンテキストを理解するため、平文で提供できます。 私たちもそれを見ると思います。 また、AI は強力な同僚のような存在であり、手持ちのツールを使用してプレーン テキストのフィードバックを提供し、改善に役立てることができるという興味深い点があります。
Emmet: Molly は、これらのものがテキストを吐き出すだけでなく、たとえばアクションも実行できる場合に何が起こるかについて触れました。 そして、それはおそらく彼らができることの完全な追加レベルです.
ここからどこにいきますか?
Molly: Fergal は、以前のポッドキャストを聞いている方のために説明すると、機械学習のディレクターです。 彼は、ML システムの理想は、隣に座って指示を与えることのできる知的な同僚のようなものであるべきだと言います。 そんな夢です。 そして、Gustavs が言ったように、自然言語によるフィードバックを提供できるようになったことは、それを管理する方法を大きく変えたにすぎません。
「この知的な、潜在的に脅威となる可能性のある同僚を、あなたをより良くするチームメイトにするにはどうすればよいでしょうか?」
Emmet:どのくらいの範囲があるのだろうか. 数年前、ロンドンに Berg という機関があり、AI の初期のイテレーションで多くの実験を行いました。 しかし、彼らの原則の 1 つは、「子犬のように頭が良くなる」ことでした。なぜなら、AI に脅威や圧倒を感じさせたくないからです。 そして、それが私たちの周りに境界線を引くという彼らの原則でした。 指を振るような「そんなことはできない」タイプのデザイナーを切り開くのは好きではありませんが、そうした安全な境界線を設定することは、デザイナーが果たすべき重要な役割でもあるのかもしれません。
モリー:その境界には役割があると思います。 私は子犬の隣で働きたいのですが、あなたは子犬のような知性を持った人と一緒に働きたいですか? デザイナーの役割は次のようなものだと思います: この知的な、潜在的に脅威となる可能性のある同僚、あなたをより良くしてくれるチームメイトをどのように作るか、この素晴らしいホワイトボードやブレインストーミング セッションを行うことができるようにすることです。他の? どうやってそれを達成するのですか? そこに魔法を加えることができます。つまり、仕事をより良くし、ワークフローを強化し、AI を人々の実際のチームメイトにします。
Emmet: 自動運転車は、広く採用されているわけではありませんが、おそらく AI の現在最も高度なアプリケーションです。 これらのレベルの自動運転の緊張と、それらのレベルを通過するにつれて増大するリスク - 考えてみれば、おそらくこれらの多くのことに当てはまるバージョンです。
モリー:ええ、つまり、それはまさに私たちがすでに述べたことです. それは提案ですか? レビューはありますか? 承認はありますか? これは、自動運転車の 5 つのレベルの私たちのバージョンです。
Gustavs:もう 1 つの興味深い点は、時間が経つにつれて、AI が改善され、単に回答を提供するだけでなく、同僚がそうするのと同じように、あなたに代わってアクションを実行できるようになるにつれて、それを理解するのが興味深い設計上の課題になるということです。ハッカーがあなたのコンピューターを乗っ取ってあちこちクリックするのではなく、誰かがあなたの隣に座ってあなたを助けているように感じさせる方法。 それをデザインで機能させることができれば、魔法のように感じられるでしょう。 または、それはめちゃくちゃ怖いかもしれません。 面白いデザインチャレンジになりそうです。
Emmet:そして、会話ルートがそれを行うための最良の方法である可能性があります. 距離を置いて対話するシステムと対比して、友好的で会話的な人物としてどの程度組み立てられているかを見るのも興味深いでしょう.
「制作の性質と構想作業は大きく変わるのでしょうか? プロンプト エンジニアリングなどの新しいスキルを習得する必要がありますか?」
数年前、振り返ってみると、ボットのハイプ サイクルと考えられるものがありました。 そして実際、Intercom は私たちに何ができるかを実験し、発見することに非常に積極的に関わっていました。 もちろん、それを活かした製品もあると申し上げました。 Resolution Bot や Custom Bot のようなもの。 しかし、そのハイプ サイクルの間に、会話型 UI にまったく適していないアプリケーションがたくさんあることもわかりました。 天気予報のボットがありましたが、「実際、天気を尋ねるのにボットは必要ありません。そのためのアプリや Web ページがあれば十分です。」 必然的に、ここでも多くのことが起こるでしょう。 おそらく会話型 UI の過剰な適用ですが、真に有用なユースケースが前面に出てきます。
もう 1 つ付け加えておきますが、会話に関して非常に強気な点は、私たちが長い間取り組んできた問題です。 チューリングテストは新しいものではありません。 それとは別に、私は数年前に Google で働いていました。 「エッフェル塔の高さは?」などの質問に答えてもらうには、膨大な量の作業と誇りがありました。 私たちが現在利用できるものと比較して、非常に基本的なように見えるもの. Siri のような音声アシスタントでさえ、11 月下旬のある朝、突然目を覚ますと、ほとんど時代遅れになっていました。
システムが改善される速度も、これの大部分を推進します。 デザイナーにとって興味深く新しいことの 1 つは、私たちが過去に Web テクノロジーなどに取り組んでいたよりも、はるかに進んでいるということです。 テクノロジーがここからどこへ向かうのかは、デザイナーとしての私たちの監督と著者のビジョンと同じくらい物事を決定づけるでしょう.
「デザイナーがこれに傾倒し、これらの言語モデルをいじくり回して、製品にどのように適用できるかを確認することが非常に重要になると思います。」
デザインに関して私が考える最後の側面は、具体的には、私たちが使用するツールと、それらが劇的に変化する可能性があるという事実です. 制作の性質と構想作業は大きく変わるのでしょうか? プロンプト エンジニアリングなどの新しいスキルを習得する必要がありますか? グスタフ、実際にデザインを行うことの変化する性質にとって、これが何を意味するかについてのハイレベルな考えはありますか?
グスタフ:ええ。 具体的には、迅速なエンジニアリングに関して言えば、時間の経過とともに、他のテクノロジーと同じ方法でそれを行うためのベスト プラクティスが出現することになると思います。 そして明らかに、それらは時間の経過とともに進化し、より良くなりますが、それがビジネスを根本的に形作る重要な差別化要因になるとは思いません. デザイナーの役割がどのように変化するかは一概には言えませんし、時期によっても異なります。 短期的には、デザイナーがこれに傾倒し、これらの言語モデルをいじって、自分の製品にどのように適用できるか、他の企業がそれを自社の製品にどのように適用しているかを確認することが非常に重要になると思います。新しいことを行うためのパターンや興味深い方法を見つけようとします。
しかし、長期的には、業界全体のデザイナーにどのような影響があるかを判断することは、はるかに困難です. したがって、AI が改善され、人間を拡張するだけでなく、書き込みやタスクの実行を完全に自動化するようになると、多くの製品や業界、さらにはそれらの製品を形作る上でデザイナーが果たす役割さえも根本的に混乱させる可能性があると思います。 わかると思います。 未解決の問題がたくさんあり、それがどのように展開するかを見るのは興味深いでしょう.
エメット:ええ。 私たちの仕事の良いところの 1 つは、ときどきテクノロジーがまったく新しい種類の手段を提供してくれることです。 これは間違いなく、私たちが働く環境を大幅に変え、デザイナーに多くの新しい課題と機会を生み出すものだと感じています. 私たち Intercom にとって、その道のりを順調に進んでおり、それに全力で取り組んでいることは非常にエキサイティングです。 AI と AI を使ったデザインにとって興味深い年になることは間違いありません。 どこにたどり着くのか楽しみです。 多分私たちはそれを残すことができます。 モリー、どうもありがとう。 グスタフ、百万人に感謝します。 あなたと話をして、この技術を使った以前の経験から学べたことは素晴らしいことでした. みんなが年をとって賢くなったらまたやるかもしれませんが、今のところ、どうもありがとう。