設計師工具箱中的 AI:使用 ChatGPT 塑造未來

已發表: 2023-02-08

隨著 GPT 的提高和大型語言模型變得更加複雜,設計思維會出現哪些新視野? 他們將如何顛覆產品設計師的傳統角色?

ChatGPT 的推出引發了一陣意見和討論的旋風,各種各樣的人就它對我們意味著什麼展開了激烈的交流。 現在,我們是第一個承認預測和投機性預測可能是徒勞的人,但有一點是肯定的——這些模型已經在我們思考和構建產品的方式上引起了翻天覆地的變化。

如果你在過去一周一直在收聽 Inside Intercom,你就會知道我們很快就加入了 GPT 潮流,設計了新的人工智能功能,並將它們交付給 160 個測試版客戶(請隨時查看第一部分和第二部分如果您還沒有,則進行兩次對話)。 今天,在我們最新一期的 GPT 聊天中,一些實際上一直在使用 ChatGPT 和大型語言模型進行應用設計工作的人加入了我們的行列,以構建能夠為客戶解決實際問題的實際產品。

在這一集中,您會聽到我們自己的聲音:

  • Emmet Connolly,產品設計副總裁
  • Molly Mahar,機器學習團隊的產品設計師
  • Gustavs Cirulis,高級首席產品設計師

他們將討論像 ChatGPT 這樣的大型語言模型 (LLM),以及它們將如何塑造未來幾年產品設計師的角色。 我們不知道未來會發生什麼,但如果您問我們,您能做的最好的事情就是投入其中。

以下是一些要點:

  • GPT 非常擅長總結內容、理解語言和編輯文本。 但一個主要問題是,有時它的答案聽起來似是而非,但實際上是錯誤的。
  • 隨著技術的發展,支持組織將通過培訓 AI 並確保支持以人類感覺自然的對話方式完成,從被動轉變為主動。
  • 可能會出現新的設計模式來管理不確定性和期望,例如在功能中建立置信度分數。
  • 隨著時間的推移,企業將能夠使用開源模型,並使用來自其行業或公司的專有數據,利用專業知識在此之上構建層。
  • 在未來,與 AI 的交互可能涉及對話界面、用於增強工作流程的圖形界面,甚至是神經界面。
  • 設計師的角色將是創建一個 AI 界面,該界面充當智能、無威脅的同事,可以增強您的工作流程並讓您的一天更輕鬆。

通過在 Apple 播客、Spotify、YouTube 上關注 Inside Intercom 或在您選擇的播放器中獲取 RSS 提要,確保您不會錯過任何亮點。 以下是該劇集經過輕微編輯的文字記錄。


初遇

埃米特康諾利:大家好。 歡迎來到內部對講播客。 今天我很高興能加入來自對講機產品設計團隊的 Molly 和 Gustavs。 自幾週前推出 ChatGPT 以來,已經有很多激烈的討論、很多隨意的猜測,以及很多關於這一切意味著什麼的紙上談兵四分衛。 我想說,其中大部分來自那些根本沒有直接接觸過這項技術的人,這就是為什麼我今天很高興能與莫莉和古斯塔夫交談。 因為 Molly 和 Gustavs 是全世界極少數真正使用 ChatGPT 和相關技術完成實際應用產品設計工作的兩個人。 我的意思是,實際使用它來與產品集成並為客戶解決實際產品問題,並讓實際產品大規模運行。 那麼,Molly 和 Gustavs,歡迎來到節目。 也許您想非常簡短地介紹一下自己。 莫莉,你想去嗎?

莫莉·馬哈爾:當然,當然。 我是莫莉·馬哈爾。 我是 Intercom 的一名職員設計師。 我是相當新的。 我加入了機器學習團隊,有一個工程師團隊,我們做了很多原型設計。

Gustavs Cirulis:嘿,我是 Gustavs。 我是首席產品設計師,我在這裡的時間比 Molly 長一些。 我到處都是,但目前,我在增長團隊工作。

“這讓我想起了大學裡的行為經濟學和鄧寧-克魯格效應,你無能但過於自信”

Emmet:今天,我們將討論 AI 和大型語言模型,例如 ChatGPT。 具體來說,關於它們對設計和設計師的意義。 我們將稍微談談設計師可以獲得哪些新機會,特別是這項新技術,您的感受或使用 AI 與傳統產品的不同之處,以及您在設計過程中遇到的一些挑戰已經開始設計這些 AI 驅動的功能。 我們甚至可能在某個時候做出一些不明智的預測。 但讓我們從基礎開始。 莫莉,幾週前當 ChatGPT 出現並引起轟動時,你的第一反應是什麼? 在此之前,您已經使用 AI 和 ML 系統工作了很長一段時間。

莫莉:嗯,首先,我在 Slack 上被大量屏幕截圖轟炸,並開始看到他們來自公司周圍的人和 Twitter 等等。 我試了一下,感覺是,“這太酷了。 這也很聰明。” 大型語言模型 (LLM) 已經存在了一段時間,但現在他們已經在他們的 API 上放置了一個 UI。 因此,世界各地越來越多的人無需成為開發人員或其他任何人就可以使用它們,我認為這非常棒,表明人們對它們有多麼興奮。 我開始玩它,它真的很強大。

你可以問它很多問題,你可以跟進。 感覺真的很神奇。 感覺有點像談話。 然後我們作為一個團隊開始深入研究,嘗試對其進行壓力測試。 我覺得我開始看到炒作了。 這讓我想起了大學裡的行為經濟學和鄧寧-克魯格效應,你無能但過於自信。 有時感覺就像那樣。 這個 ChatGPT 比我更擅長胡說八道。 我很驚訝。 因此,我經歷了一波關於它的感受。 我想知道快速概述 LLM 是否有用。

“法學碩士已經存在了一段時間,變得越來越好,越來越快。 ChatGPT 的神奇之處在於,作為一個人,我實際上可以使用它”

埃米特:我想是的。 我認為,對於很多人來說,ChatGPT 與每個人都在談論的 AI 有這種聯繫。 那麼,您介意用外行人的術語解釋一下 ChatGPT 是什麼,以及它與人們可能聽說過的其他術語(例如大型語言模型)有何關係?

莫莉:是的,我會盡力而為。 因此,大型語言模型,簡稱 LLM,是在來自世界各地的大量公共文本語料庫上訓練的模型——我認為,有時是書籍、互聯網、多模式資源。 裡面有數十億、數十億條數據。 他們經常在整個過程中接受人類反饋的培訓。 我認為這就是為什麼你可以與 ChatGPT 進行對話的原因——你可以給它反饋,它實際上會回應並改變它的反應。 法學碩士已經存在了一段時間,變得越來越好,越來越快。 ChatGPT 的神奇之處在於,作為一個人,我實際上可以使用它。 其次,它實際上非常非常好。 ChatGPT 基本上是前端,我對此進行了一些簡化,但它是 OpenAI 在後台擁有的大型語言模型 API 的前端。 他們有很多這樣的。

還有很多其他公司也有大型語言模型。 谷歌正在研究 LaMDA,還有其他公司。 因此,我們今天可能會在這裡說 ChatGPT,但我們指的是一般的技術。 我們實際上是在使用它背後的 API,而不是 ChatGPT,後者目前只能通過 UI 使用。

“以前,它只是一種,'嘿,給我寫一首關於任何東西的詩'。 現在,您可以進行來回對話。 這就是人類彼此互動的方式”

埃米特:是的。 我認為 ChatGPT 的一個有趣之處在於,在某些方面,從技術角度來看,它並不是那麼新鮮。 ChatGPT 是一款使用 GPT-3.5 構建的應用程序,由一家名為 OpenAI 的公司構建。 但是 GPT-3.5 已經存在了一段時間——幾個月,對吧,Molly? 所以,我很好奇。 古斯塔夫,你的反應是什麼? 為什麼您認為我們對 ChatGPT 與底層技術的反應不同,後者已經存在了一段時間?

Gustavs:我認為最大的區別在於演示就像一場對話,你可以在其中提出後續問題並進行更深入的探討。 以前,它只是一種,“嘿,給我寫一首關於任何東西的詩。” 現在,您可以進行來回對話。 這就是人類彼此互動的方式。 所以,這比給它一個一次性的提示要熟悉得多。 當我在 ChatGPT 剛出來的時候玩它的時候,感覺就像魔法一樣。 真的很難相信這是存在的。 我只是不停地玩弄它,談論不同的話題,感覺就像有一個按需提供的私人導師,對一切都瞭如指掌。 它談到了關於技術、歷史、心理學甚至喜劇的各種各樣的事情。 事實證明,如果你給它一個很好的提示,它真的很擅長想出單口喜劇。 這樣做也很有趣。

幻覺案例

Emmet:你們倆現在已經花了幾個星期的時間來處理這個問題。 我們最初的反應都非常令人印象深刻,但我們花了幾週時間嘗試將其應用於實際客戶問題,也許還在考慮以某種方式直接應用它,它經得起炒作嗎,Gustavs?

古斯塔夫斯:是的。 ChatGPT 一問世,我們就印象深刻,並意識到我們必須更好地理解它對我們業務的意義。 它似乎會對整個客戶服務行業產生真正有意義的影響,因此我們成立了一個小型工作組,探索 ChatGPT 的長處、短處以及它對我們的業務可能意味著什麼。 在經歷了那個練習之後,我自己的恐懼和擔憂以及炒作都減少了一點。 似乎技術還沒有完全取代我們的工作並使一切自動化。

“模型想要取悅你,所以它想給你一個它認為你想要的答案”

事實證明,它確實擅長某些事情,但並非在所有事情上都擅長。 例如,它擅長總結內容或理解語言以及編輯和創意寫作。 但是它有一個很大的幻覺缺陷,它只是編造一些聽起來很真實但實際上不正確的東西,這對於客戶服務解決方案來說顯然是一個大問題。 您不想給出聽起來似是而非但實際上不正確的答案。 但是你可以將它應用到很多有趣的事情上。 我認為最大的收穫是這項技術發展得非常快。 它能給出事實正確的答案真的只是時間問題。 一旦發生這種情況,它將真正具有破壞性。

埃米特:所以,你的意思是無論如何它都會給出答案。 在某些情況下,這會導致您所謂的幻覺。 莫莉,對於任何試圖真正使用它的人來說,這似乎是一個很大的限制。 什麼是幻覺,它們為什麼會首先發生?

莫莉:是的,正如古斯塔夫斯所說,這是一個大問題。 模型想要取悅你,所以它想給你一個它認為你想要的答案。 有時,它有可靠的信息來源,有時,它只是編造。 感覺像個孩子。 “你為什麼這麼做?” “嗯,我以為這就是你想要的。” 幻覺可能來自許多不同的來源。 如果你問它一個關於 Intercom 的問題,它不一定知道任何新東西。 因此,它可能會從其他地方獲取一些它所知道的準確的常識,對其進行插值,並在某種程度上嘗試使用常識,當然,它沒有。 它並沒有真正的推理能力。 它使用諸如“好吧,這可能以這種方式起作用,所以我可以就 Intercom 的 API 做出一些回答”之類的概率。 正如古斯塔夫所說,這非常有道理。 聽起來很有自信。

正如你提到的,不同的公司專注於不同的事情。 有些公司更關注如何盡量減少幻覺。 而 ChatGPT,我認為,通常非常關注護欄和道德規範,並清楚它拒絕回答的內容。

Emmet:你認為我們會看到大量不同模型的激增,你可以選擇最適合在絕對正確和你想要的幻覺之間進行權衡的模型,或者這是一個可能存在的問題只是隨著模型變得更成熟而消失?

“ChatGPT 說明了一些有趣的事情,那就是所有這些的 UI 和 UX 都非常重要”

莫莉:我不確定它會消失。 但是,是的,已經有很多模型了。 有開源模型,並且有可能在模型之上進行我們所謂的微調。 GPT代表generative pre-trained transformer,所以它會生成東西。 它在大型語料庫和變形金剛上進行了預訓練。 不同的公司將專注於不同的事情。 有開源模型,而 Intercom 作為這些模型的潛在用戶,可能能夠在上面進行微調,以獲得我們行業或公司的更多專業知識。 該技術也將更好地使用和需要更少的數據來擁有一個偉大的模型。 因此,模型將變得越來越小。 並且潛在地,在這一點上,對於一個較小的公司來說,在他們的數據上創建一個模型並且讓它非常專業,知識淵博並且非常可靠可能更合理。

Emmet:讓我們換個話題,更具體地談談設計。 顯然,一般來說,GPT 和 AI 主要是一個技術故事,但我認為 ChatGPT 說明了一些有趣的事情,即所有這些的 UI 和 UX 非常重要。 例如,似乎有向對話式 UI 的轉變。 你認為這是真的嗎? Molly,設計在塑造我們使用這項技術所做的事情中的作用是什麼?

莫莉:我的意思是,Intercom 的定位非常好。 我們的業務是關於對話和客戶服務,人們對與這項技術進行對話感到非常興奮。 但我們最近發現,至少目前,這項技術的強大功能實際上並非直接用於對話,而是與對話和語言有關。

正如我們所提到的,它非常擅長總結,並且有大量的工作流程,其中總結可以真正幫助客戶服務代理。 我們最近向一些客戶推出了測試版,總結是人們發現非常、非常、非常有價值的東西之一。 我們還添加了一些生成文本工具,以允許銷售代表修改他們的消息,如果他們想重新措辭、使它們更友好、更正式一些,或者獲得幫助來澄清事情。 這是對話的一部分,但不是直接與 ChatGPT 對話。 我們還發現它有助於生成諸如幫助中心文章之類的內容,這也是此測試版的一部分。 這在一些更隱蔽的應用程序中發揮了很大的作用,這些應用程序對於外行人來說並不那麼明顯,但對於銷售代表來說卻非常耗時。 我們可以為此提供很多價值。

“你正在尋找技術擅長的事物與風險相對較低的事物的交集。 在接下來的幾個月裡,我們會看到很多這樣的人”

古斯塔夫斯:是的。 您可以通過多種方式使用這項技術,並通過這種方式迴避我們已經看到的一些問題,特別是幻覺,它在其中編造了不正確的東西。 但它在其他方面確實很擅長。 它擅長重新措辭現有內容,並且以它為主導是有意義的,因為它可以提供明確的價值。 最終目標是完全自動化並實際給出答案。 只是技術還不夠好。 但我認為我們會到達那裡。

埃米特:我懷疑這將是我們在整個 2023 年看到的情況,因為我想我們會開始看到這種情況蔓延到許多不同的產品中,可能以相對簡單、萬無一失的方式開始,然後越來越多地把船推出去就其功能的複雜性而言。 我認為,我們所有人都懷著興奮和可能還有一點健康的恐懼來迎接這個機會。 莫莉,你提到我們目前在測試版中有 ChatGPT 支持的這些功能。 反饋非常令人振奮和積極。 我們看到的最早跡像是真正的客戶從功能中獲得真正的實用性,例如在將對話交給其他人之前對其進行總結。 您正在尋找技術擅長的事物與風險相對較低的事物的交集。 在接下來的幾個月裡,我們會看到很多這樣的情況。 所以,這將是令人興奮的。

對話式人工智能

Emmet: Gustavs,你一直在從長遠的角度考慮這個問題。 你能談談嗎? 你提到了對講機——我們在這裡談論這個的原因之一是,考慮到我們產品的性質,即對話式客戶服務,我們可能處於非常有利的位置,以充分利用這一點。 當您考慮長期的產品和設計機會時,您怎麼看?

Gustavs:在 ChatGPT 發布的早期,我們舉辦了這個研討會來嘗試思考未來,特別是關於如果我們有一個沒有這種幻覺問題並且能夠給出的模型,世界會是什麼樣子好的答案或說“我不知道”。 它真的很有前途,它確實增強了我們對許多我們已經相信但正在加速發展的事情的信心。 我們相信大多數支持查詢將完全自動解決,無需與人工交談。 如今,隨著越來越多的“如果這樣,那麼那樣”類型的構建器、機器人和我們自己的解析機器人,它已經在增加,它具有一些機器學習能力,但程度與 ChatGPT 不同。

“大部分支持將以對人類來說最自然的方式發生,即通過對話”

我們已經走上了這條道路,但它會加速。 因此,支持組織將開始從被動的和主要在收件箱中轉變為主動的——設置和培訓人工智能; 編寫 AI 可以用來解決對話的內容。

我認為大多數支持將以對人類來說最自然的方式發生,即通過對話。 想像一下,如果您有一個可以隨時與之交談的人,他會為您提供個性化的答案。 這是人類最自然的互動方式。 我們今天擁有的這種搜索和瀏覽體驗,您在 Google 上搜索某些內容並對其進行掃描以嘗試快速找到內容中某處的答案,這對人類來說並不自然。 在您開始對話之前,仍然會有一些版本提供可能與您相關的內容建議。 但是當你與它互動時,它仍然可以是對話式的。

我們認為,出於多種原因,我們還需要建造一座橋樑才能到達那裡。 我認為我們首先會看到通過總結或改寫等方式增加支持代表。 稍後,我們將獲得支持代表可以編輯和改進的回復建議,稍後,我們將進入完全自動化。 無論是技術方面還是人為方面,都需要一段時間才能習慣使用越來越多的自動化。

Emmet:你描述的是,在產品的一個非常廣泛的表面區域,有很多不同的地方可以改變我們的工作方式,我們稱之為隊友體驗和最終用戶體驗,在這兩個方面談話的雙方。 但你也描述了我們將如何實現“我們認為技術會實現”這個模糊的未來的模糊概念。 它給我留下了深刻的印象,因為它是當今思考設計的一種非常不同的方式,並且幾乎是我們思考與計算機交互的方式的深刻差異,從非常確定性、非常強硬的東西——真與假、1 和 0——到某種東西方式更模糊。

新的設計模式

Emmet:設計師現在正在考慮使用這種感覺比 CRUD 應用程序更不可知、更可塑且更不僵化的材料,我們已經習慣了“創建、編寫、更新、刪除”。 你發現了什麼? 設計師需要如何處理他們的工作有很大的不同嗎? 您是否發現某些事情很困難或具有挑戰性? 設計師需要學習新技能嗎? 這對於設計行為來說有多大的變化,事實上我們設計的材料幾乎已經融入了這種不可知的元素?

“隨著時間的推移,我們會看到越來越多的新設計模式出現,以解決如何管理這種不確定性和各方面的期望”

莫莉:我認為我們的工作仍有很多內容將保持不變。 我們正在尋找問題,挖掘人們的工作流程,尋找模式。 一件大事是需要為更多的失敗案例進行設計,因為不一定有護欄。 當您進行對話時,它可能會以多種不同的方式偏離軌道。 像這樣的系統也是如此。 人類作為一個物種,並不擅長概率。 當我們查看天氣預報並發現下雨的可能性為 40% 時,我們並不清楚這意味著什麼。

埃米特:是的,如果不下雨你會很失望,因為你被告知會下雨。

莫莉:是的。 我在荷蘭——當我看到任何下雨的機會時,我就像,“會下雨的。 只是多長時間的問題。” 這就是百分比對我的意義。 但我們並不擅長解釋它們。 我認為,當我們看到這些預測的可信度時,這肯定會有所作為,因為它們是對接下來應該出現的詞的預測。 我們會在這方面做得更好。 有很多關於這項技術移動和變化的速度的處理,我認為這不會改變。 有很多原型設計和反應以及對延遲的思考。 現在的延遲可能會很長——為此而設計。 而且還有很多意想不到的結果。 這些是我一直注意到的一些事情。

Gustavs:我認為,隨著時間的推移,我們會看到越來越多的新設計模式出現,以解決如何管理這種不確定性和各方面的期望。 目前,每個人都在試驗,看看什麼是有效的。 我們已經看到一些模式出現了,這些模式帶有關於如何更改文本的小的預定義提示,例如“展開”、“總結”、“使其更友好”。 這是一種開始出現的相對較新的模式,我認為我們會看到越來越多的此類模式。 即使是這種交互,如果您要求 ChatGPT 生成內容,它也會有緩慢移動的光標。 這也是一個有趣的設計模式。 這在技術上是必需的,但它可以很好地設定“嘿,這是 AI 即時生成內容”的期望。

“在這些可能非常自動化的新系統中,我們是否正在考慮增加一些摩擦,以便我們保留我們認為有價值和我們想要擁有的技能?”

埃米特:所以,你是說這種逐字逐句的打字效果,明確地說,是一種技術如何逐字逐句組合的功能,可以成為同義詞和視覺名片. 也許這會發生,也許不會,但是當我們看到這些轉變和新技術出現時往往會出現的事情類型可能很有趣,以深入研究新設計模式出現的想法,因為當新技術出現時我們確實看到了這一點沿著。 Molly,你有沒有遇到過其他人,無論是在非常低的交互設計水平上,還是在如何將其縫合到產品中的高水平上?

莫莉:我認為還有其他一些事情會開始出現得更多。 例如,當我們嘗試開發一項功能時,工程師會進行回溯測試。 例如,他們使用過去的數據並據此做出預測,然後將其與隊友實際所說的進行比較。 對於這樣的事情,我們可能需要開始啟動的不是最終用戶,而是團隊成員或管理員,管理 CS 組織的人可能希望擁有我稱之為暗啟動的東西——他們沒有實時的東西,但是能夠看著他們並有一種感覺,“好吧,我現在相信這會過去。” 暗啟動的不同階段、建議草案以及啟動其中一些工具的不同階段。 我認為這會更加突出。

我不知道它會朝哪個方向發展,但我考慮了一些我們可能不得不在系統中增加摩擦的地方,這樣我們就不會自滿。 飛行員仍然會完成飛行的某些部分,儘管大部分是由自動駕駛系統完成的,因為他們需要不要忘記如何飛行。 所以,他們正在做著陸或其他事情。 在這些可能非常自動化的新系統中,我們是否正在考慮增加一些摩擦,以便我們保留我們認為有價值和我們想要擁有的技能?

Emmet:很明顯,幾乎所有東西都對你必須設計的內置功能有一個隱含的置信度分數。 這是我們要向銷售代表和管理員或他們的客戶公開的內容嗎? 我們向他們的客戶展示東西的門檻更高,甚至在細節層次上也更低。 以總結長時間對話的能力為例。 你是點擊一個按鈕就把總結直接發佈到對話線程中,還是讓別人有機會審查和批准它? 讓它直接通過還是增加審批門? 我認為我們可能會看到許多工作流程出現,至少在最初是這樣,然後,隨著技術建立越來越大的信心,它們是否會開始下降?

莫莉:是的,沒錯。

Gustavs:甚至只是能夠告訴你它有多自信。 如果 AI 可以告訴您,“嘿,這是我的答案,它的正確率為 40%”,您可能會在發送之前將其提交給人類以供批准。 如果它有 90% 的信心,您可以繼續並直接發送它,並在最終用戶端有一個“嘿,這是不正確的”按鈕。 這實際上取決於技術如何發展。 設計將不得不隨之發展。

埃米特:是的。 上帝,請賜予我大型語言模型的信心,因為它絕對自信地說出完全錯誤和完全正確,而不區分它們。 這就是信任。 目前,沒有任何內容表明“我對這份聲明有 100% 的信心。” 至少在 ChatGPT 中。 在其他一些語言模型中,我相信我們開始看到引用的來源,這似乎是積極的一步。

在上面添加圖層

埃米特:似乎有很多未知的事情,很多細節,像這樣的深度設計決策需要參與進來。讓我們來看看這些大趨勢對設計和產品意味著什麼。 人們目睹或參與了重大新技術的到來。 我正在考慮諸如雲之類的事情,或者大規模轉向 Web 和移動作為重要的支持技術,這些技術導致了這個全新的設計模式和產品世界,這在以前是不可用的。 有了雲,我們看到了表單、提要和點贊,以及網絡經歷的所有視覺轉換。

對於移動設備,您可以說很多相同的東西——從提要和漢堡菜單到下拉刷新和滑動刪除,我們現在將其視為設計師工具包的一部分。 也許我們離預測時間已經很危險了,但你早期的工作經驗是什麼? 它是否告訴您什麼類型的產品將贏或輸,以及我們可能會看到哪些以前甚至不可能出現的新事物?

“我認為,將要獲勝的企業將擁有某種專有數據和飛輪效應,不斷收集和改進這些數據”

Gustavs:我認為,隨著時間的推移,大多數企業將使用這些公開可用的大型語言模型,而不是創建自己的模型。 但為了彼此區分開來,他們可能會用專業知識在它們之上構建層。 例如,您可能擁有特定於業務的數據——對於支持工具,它可能是對有關您產品的特定問題的回答,以及您的支持代表給出的特定答案,而不是一般知識。 它可能是對特定領域的真正深入的了解,例如法律。

我認為,將要獲勝的企業將擁有某種專有數據和飛輪效應,不斷收集和改進這些數據。 另一件我認為很有趣的事情是看看像谷歌、蘋果和微軟這樣的大公司是如何使用這項技術的,以及他們如何將它集成到操作系統級別。 這可能會對其他企業可以使用什麼樣的利基市場產生巨大影響。

“OpenAI 每天要損失數百萬來運行 ChatGPT,從公關的角度或他們正在收集的任何研究數據來看,這可能是值得的,但這也意味著它不會是免費和悠閒的”

Emmet:您一開始就說大多數人會以某種方式集成這些大型語言模型。 我認為那些沒能按照你所說的去做的企業,實際上找到了某種防禦護城河,會發現自己基本上是 GPT 的薄包裝,實際上並沒有做很多其他事情。 所以,我完全同意你的看法。 如果你想想 App Store 或移動應用商店之類的東西,早期有很多玩具和手電筒之類的東西。 然後,逐漸地,它搖搖欲墜,成為像優步這樣的大公司,如果我們沒有這個模式,它就不會存在,還有 Instagram 和地圖等等。 Molly,根據您的經驗,您想添加什麼?

Molly:我不完全確定每個人都會使用公共 LLM。 我有點擔心它們要么對許多公司來說過於昂貴而無法使他們的商業模式發揮作用,要么一些大公司可能會將它們私有化。 所以,我不確定是否每個人都會使用公共的,或者人們是否會更多地轉向開源並將他們的微調層放在上面。 我同意數據模式。 例如,在 Intercom,我們有大量的對話數據,我們能夠做 Apple 在操作系統級別上不一定能做的事情。 這為我們提供了一些價值。 正如您所說,我認為成功的產品將不僅僅是頂層的商品層,而是深入理解問題或工作流程並將其與他們的數據模式集成的產品。

埃米特:你還談到了一些暫時對限制很重要的事情。 它很慢。 返迴響應需要幾秒鐘。 會有一些產品或空間不適合。 它在計算能力方面也很昂貴,因此在金錢方面也很昂貴。 您可能比我更了解這一點,但每個請求都要花費幾美分。 OpenAI 每天因運行 ChatGPT 而損失數百萬美元,從公關的角度或他們正在收集的任何研究數據來看,這可能是值得的,但這也意味著它不會是免費和悠閒的。 雖然技術有一個很好的習慣,那就是隨著時間的推移變得更快、更便宜,而且這可能會發生在這裡,但就目前而言,存在限制應用程序的某些限制。 也許我們在實時應用程序中會更少看到它。 也許我們在 B2C 應用程序中看到的會更少,因為在 B2C 應用程序中運行這些類型的查詢的規模和成本可能是巨大的。 看看那裡的情況也會很有趣。

接口的未來

Emmet:我很想深入探討設計對話,並實際思考這些生成系統以及我們將如何與它們交互。 我們指的是所有新的點擊和滑動以及新平台出現時您可以做的事情。 這是我們不可避免地必須小心翼翼地進入預測世界的地方。 我們都可以在一兩年後回顧這一點,並嘲笑我們錯得多麼離譜,但有一種有趣的感覺,也許這正在轉向更多基於文本、幾乎基於命令行的交互方式。 產品中的另一種微趨勢是這個命令 + K 調色板,你可以通過點擊快捷方式並輸入你想要執行的操作來彈出它。 我們在很多產品中都看到了這一點,這有助於人們普遍認為將文本和自然語言作為一種直接的交互方式。

“我不認為我們必須選擇一種方式來與 AI 交互。 這是一個非常廣泛的功能,可以以不同的方式應用於不同的用例”

另一方面,如果你看看以前的趨勢,尤其是我們從命令行界面經歷的旅程,我們最終會在上面構建非常詳細的圖形用戶界面。 因此,我想知道您是否願意推測一下您對這件事的看法。 這是否預示著 21 世紀將轉向更多的命令行界面? 在我們弄清楚這些東西上的圖形用戶界面層是什麼樣子之前,這是一個臨時的命令行東西嗎? 現在說是不是太早了?

古斯塔夫斯:嗯,我想我們會擁有所有這些。 我不認為我們必須選擇一種方式來與 AI 交互。 這是一個非常廣泛的功能,可以以不同的方式應用於不同的用例。 因此,例如,如果您正在尋找答案,對話將是獲得答案的主要方式。 但是,如果我們談論使用 AI 來增強工作流程,我認為我們會看到圖形界面,其中包含供 AI 執行的預定義操作。 這與我們今天看到的 X 的總結、改寫和整個副駕駛浪潮一樣。

對於工作流程自動化,我的意思是使用 AI 來改進您的工作方式。 因此,例如,在客戶支持中,當您使用 AI 來改進這些回复時,您正在給客戶寫回复。 再次,擴展一個點或總結直到那個點的對話。 我認為可以為這些類型的工作流增強提供圖形界面。

Molly:我不擅長預測,但正如您所說,我們可能會出現某種擴散,command + K 界面或您可以執行的操作的不同選項。 這項技術的挑戰之一是它可以做什麼的可發現性。 您可以在此提示中鍵入任何內容。 “像海盜一樣給我寫一首莎士比亞的詩,”或者什麼的。 我們將設置一些護欄,但我認為我們可能會擴大範圍,然後隨著事情變得更加普遍和有用,我們會縮小範圍。 然後,最終,一旦我們了解了這項技術的功能,也許就可以使用更多基於文本、基於對話或完全開放的界面。

當我們習慣於與我們的系統交談時,我也對神經接口的潛力感到興奮。 如果我能想到它,為什麼要談論它? 我知道這還有很長的路要走,但當我在伯克利時,我的一些同事正在研究這個問題。 這真的很酷。 在很多情況下你不想說話和打字,這會打開局面。 也許在更遠的將來,我們將擁有可以接受非 GUI 指令並將其轉化為動作的集成系統。 我們已經看到其中一些系統可以採用自然語言查詢和指令,並將它們轉化為您計算機上的操作。 事實上,其中一些 LLM 也非常擅長生成代碼,例如 GitHub co-pilot。 因此,那裡有很多潛力。

Emmet:我懷疑文本操作將在軟件領域大放異彩,因為這裡有很多直接的可能性。 能夠突出顯示一段文本並說“讓它更友好”感覺非常自然。 幾乎感覺它與粗體和斜體一起屬於工具調色板。 這只是一種操縱現有文本的方式。 然後,有很多方法可以更進一步,例如生成或代碼生成。

我個人發現使用圖像生成器的體驗非常不同。 同樣,我們對這些系統的很多體驗都是看到結果滾動,比如 ChatGPT 的屏幕截圖或 DALL-E、Midjourney 或 Stable Diffusion 創建的東西。 圖像生成器的創建過程對我來說感覺很笨重,並且可能是 GUI 化的並且具有更具觸覺的屏幕界面。 必須在異常藝術的短 F 停止趨勢中填充提示,以嘗試讓它創建您想要的輸出,這顯然是一種黑客行為。 並且有很多不同風格的維度你想要通過某種旋鈕和刻度盤和滑塊來更好地服務。 我想我的預測是我們將看到今天存在的提示工程將被希望更好的東西所取代。

“人工智能就像一個超級強大的同事,可以使用你擁有的工具,你可以給他們提供純文本反饋以幫助他們改進,這有一些有趣的地方”

只是為了完成這個想法,視頻和音頻是非常不同的,因為你必須坐下來很長時間來回顧結果。 你可以盯著一百張圖片或瀏覽一些文字,但老實說,我對此的看法較少,因為我投入的時間較少。 但我想這又回到了你最終所說的,Gustavs。 這不是一個令人滿意的答案,但它會在很大程度上取決於。 而且我認為這在很大程度上取決於我正在操縱的東西。 我們可能會有非常不同的用戶界面,這取決於它。

Gustavs:與此同時,我認為將會有新的有趣應用來提供自然語言指令。 例如,當我們進行初步探索時,我們發現一件有趣的事情是,你訓練 AI 的方式可以非常、非常相似或幾乎相同,就好像 AI 是一個支持代理,你可以向他們反饋你的政策如何與客戶互動或使用何種語調。 即使當你對個人對話提供反饋時,你也可以只提供純文本,因為它理解自然語言和上下文。 我想我們也會看到這一點。 有趣的是,人工智能就像一個超級強大的同事,可以使用你擁有的工具,你可以給他們純文本反饋來幫助他們改進。

Emmet:例如,Molly 談到了當這些東西不僅吐出文本,而且還可以採取行動時會發生什麼。 這可能是他們能力的一個全新層次。

我們從這裡去哪裡?

Molly:對於那些聽過一些早期播客的人來說,Fergal 是機器學習的主管。 他說,他對 ML 系統的理想應該是坐在你旁邊的一位聰明的同事,你可以向他發出指令,並且它會實際執行得很好。 這就是夢想。 因此,正如 Gustavs 所說,能夠提供自然語言反饋正是我們管理方式的巨大變化。

“我們如何讓這個聰明的、可能具有威脅性的同事成為一個讓你變得更好的隊友?”

埃米特:我什至想知道會有多少範圍。 幾年前在倫敦有一家名為 Berg 的機構,他們對早期的 AI 迭代進行了大量實驗。 但他們的原則之一是“像小狗一樣聰明”,因為他們不希望 AI 感到威脅或不知所措。 這就是他們在我們周圍劃定界限的原則。 我不喜歡把設計師塑造成搖擺不定的“你不能那樣做”的類型,但也許設置這些安全界限對設計師來說也是一個重要的角色。

莫莉:我認為這些界限是有作用的。 我確實想和一隻小狗一起工作,但你想和一個像小狗一樣聰明的人一起工作嗎? 我認為設計師的角色是:我們如何讓這個聰明的、可能具有威脅性的同事,一個讓你變得更好的隊友,讓他能夠擁有這個非常棒的白板、頭腦風暴會議,你可以在其中重複每一個其他? 我們如何做到這一點? 這就是我們真正可以添加這種魔力的地方——讓工作日變得更好,增強工作流程,並讓 AI 成為人們真正的隊友。

Emmet:自動駕駛汽車可能是目前人工智能最先進的應用,儘管它還沒有達到廣泛的採用水平。 這些級別的自動駕駛帶來的緊張感以及在您通過這些級別時不斷增加的風險——如果您考慮一下,其中的一個版本可能適用於很多這些事情。

莫莉:是的,我的意思是,這正是我們已經提到的。 這是一個建議嗎? 有評論嗎? 有審批嗎? 這只是我們的五個級別的自動駕駛汽車版本。

Gustavs:另一件有趣的事情是,隨著時間的推移,隨著 AI 變得更好,它不僅能夠給出答案,還能代表你執行操作,類似於同事可能會做的事情,這將是一個有趣的設計挑戰來計算想出一種方法,讓它感覺就像有人坐在你旁邊幫助你,而不是黑客劫持你的電腦並點擊周圍的東西。 如果你能讓它與設計一起工作,它會讓人感覺很神奇。 或者它可能是瘋狂的可怕。 這將是一個有趣的設計挑戰。

埃米特:對話方式可能是最好的方式。 與遠距離交互的系統相比,它被框定為友好和對話的人的程度也將很有趣。

“製作和構思工作的性質會發生很大變化嗎? 我們是否必須學習新技能,例如快速工程?”

幾年前,回想起來,您可以將其視為機器人炒作週期。 實際上,Intercom 非常積極地參與試驗並找出我們可以做什麼。 當然,正如我們已經提到的,我們有利用這一點的產品。 諸如 Resolution Bot 和 Custom Bots 之類的東西。 但我們還發現,在那個炒作週期中,有一大堆應用程序根本不適合會話 UI。 有一個天氣機器人,你會說,“實際上,我不需要機器人來詢問天氣情況——我有一個應用程序或一個網頁可以滿足這個需求。” 我們也不可避免地會在這裡看到很多這樣的事情發生。 可能是對話式 UI 的過度應用,但隨後真正有用的用例脫穎而出。

我要補充的另一件事讓我非常看好對話的事情是我們一直在努力解決的問題。 圖靈測試並不新鮮。 但除此之外,我幾年前在谷歌工作過。 有大量的搜索工作,並以讓它回答諸如“埃菲爾鐵塔有多高?”之類的問題而自豪。 與我們現在可用的東西相比,這似乎是超級基礎的東西。 甚至像 Siri 這樣的語音助手在 11 月底的一個早晨突然醒來,發現它幾乎已經過時了。

系統變得更好的速度也將真正推動其中的很大一部分。 對設計師來說,有趣的新事物之一是,與過去使用網絡技術或其他任何技術相比,我們在更大程度上順應潮流。 技術從這裡走向何方將決定我們作為設計師的導演作者的願景。

“我認為對於設計師來說,了解這一點非常重要,只是嘗試和修補這些語言模型,看看如何將它們應用到您的產品中”

我在設計方面考慮的最後一個維度,特別是我們使用的工具以及它們有可能發生巨大變化的事實。 製作和構思工作的性質會發生很大變化嗎? 我們是否必須學習新技能,例如快速工程? Gustavs,關於這對實際進行設計的性質的改變意味著什麼有什麼高層次的想法嗎?

古斯塔夫斯:是的。 具體而言,就提示工程而言,我認為,隨著時間的推移,我們將看到如何以與任何其他技術相同的方式做到這一點的最佳實踐的出現。 顯然,它們會隨著時間的推移而發展並變得更好,但我認為這不會成為從根本上塑造您的業務的關鍵差異化因素。 很難說設計師的角色會發生怎樣的變化,這取決於時間框架。 在短期內,我認為對於設計師來說,了解這一點非常重要,只是嘗試和修補這些語言模型,看看如何將它們應用到您的產品中,其他企業如何將其應用到他們的產品中,以及嘗試找到做新事物的模式和有趣的方法。

但從長遠來看,要判斷對整個行業設​​計師的影響要困難得多。 因此,隨著人工智能變得更好,不僅在增強人類方面,而且在編寫和執行任務的完全自動化方面,我認為這會從根本上顛覆許多產品和行業,甚至顛覆設計師在塑造這些產品中所扮演的角色。 我想我們會看到的。 很多懸而未決的問題,看看結果如何會很有趣。

埃米特:是的。 做我們所做的事情的好處之一是,偶爾,技術​​會為您提供一條全新的途徑,您可以追求。 這絕對讓人感覺它會極大地改變我們工作的環境,並為設計師創造大量新的挑戰和機遇。 對於我們在 Intercom 的人來說,一路走好並完全致力於這條道路是非常令人興奮的。 毫無疑問,對於 AI 和使用 AI 進行設計來說,這將是有趣的一年。 我期待著看到我們的進展。 也許我們可以就此打住。 莫莉,非常感謝你。 古斯塔夫,感謝一百萬。 很高興與您聊天並從您以前使用該技術的經驗中學習。 也許當我們都變老變聰明時,我們會再做一次,但現在,非常感謝。

內部對講播客(橫向) (1)