AI を活用した UI (別名「チャットの復活」)

公開: 2023-08-11

AI 革命はモバイルよりもクラウドよりも大きく、Intercom の一部の人はインターネットそのものよりもさらに大きいと主張しています。

予測の多くは、新機能によってソフトウェアがどのように大幅に強力になるかに基づいています。説明から画像をレンダリングする機能、長文を聞いて読んで数秒で要約する機能、問題を診断し、トピックを分類し、アクションを実行する機能です。すべて思考のスピードで。 この新しい力はすべてソフトウェア製品を大きく変えることになるでしょう、そして私たちはすでにその片鱗を目にしています。 私が期待するもう 1 つの大きな変化は、製品への標準インターフェイスとしてチャット UI (別名自然言語インターフェイス) が登場することです。

ニール・スティーブンソンの壮大なエッセイ/暴言「始まりはコマンドラインだった」(当然のことながら) コマンド ラインはポイント アンド クリック (またはタッチ アンド スワイプ) インターフェイスよりも効果的かつ効率的であると主張しました。 しかし、それらは直観的ではなく、世界のごく一部の人にとってはアクセス可能ではありません (画像のサイズを変更することが単純なfind . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \;離してください。)

コマンド ラインには、ばかばかしい名前と複雑な構文を持つ難解なコマンドが多数ありますが、LLM を利用したチャットははるかに寛容です。 画像のサイズを変更してほしいと伝えるには十数種類の方法があり、LLM はそのすべてを理解します。

これと同じ議論を UI に適用すると、いくつかの類似点が見つかるでしょう。 たとえば、これは 600 億ドル相当の製品である Workday です。 ログイン方法を覚えているときは、しぶしぶ休暇を申請するために使用します。 確かにコマンドラインよりも簡単ですが、それでも適切なフォームを見つけて記入する一連の手順が必要です。

ここで自問してみてください。「結婚記念日のため 10 月 14 日は休みたいです」と入力するのと、無限のタブ、ゴースト ボタン、ドロップダウンで上記の UI を操作するのと、どちらが簡単ですか? ボーナスポイントとして、私が「結婚記念日のため 10 月 14 日は休みたいです」と入力するよりも速く一般的な UI をデザインできるかどうか自問してみてください。 それは簡単ではありません…実際、キーボードファーストのインターフェイスに対する大きな需要がすでに現れてきましたが、それはこれほど直感的になる前のことでした。 別の言い方をすると、Workday がこのタイプの UI を (少なくとも) 追加するまでどれくらいかかるでしょうか?

(わかりました、聞こえます、はい、何年もかかるかもしれません。)

私たちは簡単に実現できる AI 成果から始めました

今日、AI チャットボットは、検索エンジン、記事執筆、カスタマー サポート メッセンジャーなど、テキスト ボックスとの対話がすでに期待されていた分野で繁栄しています (こんにちは、フィン!)。しかし、それだけにとどまりません。これらは単に最も簡単で、 AI の最も無線に適したユースケース。 デザイナーとして、私たちは自分の仕事のほとんどが、たとえそれが美しいタイポグラフィーを備えたものであっても、1 つの丸い長方形に集約されることを受け入れる準備ができていないかもしれません。

しかし、チャット UI は、必然的にハードコアなユーザー インターフェイス、言語、またはコマンドによって以前は制約されていた製品を変革することになるでしょう。 わかりやすい例として、Excel を使用していて、すべての陰性セルを赤で強調表示したいとします。どうすればよいでしょうか? 私たちのほとんどは Google にアクセスし、探している単語が条件付き書式であることを思い出し、次に「条件付き書式 Excel」を再度 Google で検索します。その後、Google の回答ボックスに何をすべきか説明されているため、Excel に戻り、次の手順を実行します。これらの指示はロボットによって行われます。 そして、途中で一時的に得たすべての知識を即座に記憶し、最初にやろうとしていたことに戻ります。

今日では、ボットにそれを依頼するだけで済みます。 チャット UI は、ソフトウェアへのアクセスの大幅な民主化につながる可能性があります。

チャット UI で複雑なソフトウェアがより快適に

ほとんどのエンタープライズ製品ユーザーは永遠の初心者です。彼らは、最も頻繁に必要な 1 つまたは 2 つのタスクを実行するのに十分な知識を持っていますが、それを超えると、結果に至るまでにただハッキングしてスクラップするだけです。 彼らは、達成したいタスクについて多くの考えを持っていますが、その方法がわかりません。 この上流の障害は下流にも伝わり、気が付けばその製品が何か良いものであるか、あるいは問題を解決できるかという考えを放棄してしまいます。 既存の機能のせいで競合他社に顧客を奪われたことがあるなら、この痛みを経験したことがあるはずです

Google Analytics や Salesforce、あるいはそれらの強力で複雑な製品を思い浮かべてください。 「最もパフォーマンスの高いトラフィック ソースはどこで入手できるのか、最新の新しいソースは何なのか?」といった重要な質問に対する正しい答えが、奥深くにどこかに眠っているのはご存知でしょう。 、または「取引が増加している競合他社は何ですか?」 , しかし、自分で調べられる可能性はありません。 したがって、地元の専門家に尋ねるか、答えをでっち上げて誰もバレないことを祈るかのどちらかです。

たとえそれが美しくエレガントであっても、UI を学ぶことに時間をかける価値があることはほとんどありません。

しかし、やろうとしていることをただ入力(または発言)し、それが起こるのを見ることができれば、障壁は消え去ります。 誰もが専門知識を取得し、誰もがパワー ユーザーになり、突然製品がゲームチェンジャーとなります。 これを視覚化するための非常に簡単な方法を 1 つ紹介します。

これらすべての製品には、やりたいことはわかっていても、その方法がわからないユーザーがいます。 Natural Language UI は、このギャップをほぼゼロにまで縮めます。

早期リリースのチャット UI

私たちはすでにこのアプローチの例をいくつか実際に目にしています。

  • Equals: 元 Intercomrades 2 人によって構築された Equals は、ライブ データへのライブ接続を備えた次世代のスプレッドシートです。 (免責事項/開示: 私は投資家です。) やろうとしていることを入力すると、Equals が解決して、あなたが知らなかった、自分では解決できなかった Excel コマンドを生成します。 。

  • Mixpanel: イベント分析会社は最近、データについてわかりやすい言葉で質問できる生成 AI チャット インターフェイスである Spark を発表しました。

  • Stripe: Stripe は、顧客が自然言語を使用して複雑な詐欺防止ルールを作成できるようにする新しい Radar 機能を発表しました。

ここでは入力メカニズムとしてのチャット UI に焦点を当てていますが、出力としてのチャットのほうが扱いにくいのは事実です。視覚的な優先順位付け、階層、デザイン、レイアウトなど、多くの目的においてチャット バブルよりも優れているからです。 たとえば、ダッシュボードなどは本質的に視覚的なアイテムであり、テキスト応答で置き換えることはできません。 ただし、UI が大幅に薄れている製品が多数ある可能性があります。たとえば、「10 月 14 日は休暇を予約します」→「完了」は完全に許容できるインタラクションです。

ソフトウェアが進むべき方向は、人間とソフトウェアの間のマルチモーダルで混合方式のコミュニケーションであると私は信じています。 これまでは「ポイント アンド クリック」「タップ アンド スワイプ」がありましたが、今は「入力して言う」時代です。 洗練された製品へのアクセスが民主化されることで、製品とユーザーも同様に変化します。 結局のところ、すべてのユーザーが製品のすべての操作方法を理解できるようになったら、ビジネスはどう変わるでしょうか? 競合他社が知る前に調べてください。

フィンローンチCTA水平