MUM:谷歌用於復雜搜索查詢的新技術
已發表: 2021-10-04什麼是 MUM(多任務統一模式)? 它是如何工作的? 目標是什麼? 在這篇文章中,我將向您介紹這項基於 Google 人工智能的新技術的世界。 未來 SEO 將如何變化?
MUM(多任務統一模型)的定義
MUM是Multitask Unified Model的首字母縮寫詞,是Google 的一項新技術,可以更好地理解用戶在搜索引擎上進行的搜索查詢,即使他們使用精確且清晰的單詞或短語也是如此。
其目的是減少獲得答案所需的問題數量,為用戶提供更好的性能和更令人滿意的結果,並比以前的模型更全面地理解信息和世界知識。
Google 高級副總裁 Prabhakar Raghavan 在 Google I/O 2021 的舞台上介紹 MUM。
Google 給出了 MUM 的定義:
“谷歌正在內部探索新技術,以更好地理解語言並更容易獲得對複雜搜索需求的有用響應”。
Google I/O 2021#google #googleio #googleio2021 #LaMDA #languagemodelfordialogueapplications #openendeddailogue #autodelete #TPUv4 #tensorprocessingunits #tpuv4pods #4096chips #quantumcomputing #quantumtechnology #googlesearch #mum #multitaskunifiedmodel #Android12 pic.twitter.com/h6XF3f3Tb3
— KARRYONUS (@karryonus) 2021 年 5 月 19 日
MUM 背後的技術
現在我們有了 MUM 的定義,讓我們看看它的一些特性,以更好地理解它旁邊的技術。
- MUM 功能強大:它使用 T5 文本到文本框架,基於 Transformer 架構,但比 BERT(Transformers 的雙向編碼器表示)強大 1000 倍。
- MUM 是多語言的:它能夠一次理解 75 種不同的語言和許多不同的任務,比以前的模型理解更全面。
- MUM 是多模式的:這意味著它可以同時理解來自不同格式的信息,如網頁、文本和圖像,但在未來,甚至可以同時來自視頻和音頻。
- MUM 是複雜的:它是一種旨在理解最複雜、最精確和最清晰的搜索查詢的技術,通常需要平均 8 個步驟才能獲得完整的答案。 因此,新的人工智能將促進用戶的瀏覽過程。
今天的搜索引擎還不夠複雜,無法像專家那樣回答問題。 但是通過一項稱為多任務統一模型 (MUM) 的新技術,我們離幫助您解決這些類型的複雜需求越來越近了。 因此,在未來,您將需要更少的搜索來完成工作。
Google IO'21 – Google 搜索的新功能 – LaMDA | 多任務統一模型 – MUM | 這會改變 SEO 嗎?
Prabhakar Raghavan,Google 高級副總裁,Google I/O 2021 – 媽媽:這會改變 SEO 嗎?
Google MUM 有什麼好處
MUM 最重要的好處之一是可以縮短搜索會話。
在復雜的查詢中,MUM不僅可以理解顯式上下文,甚至可以理解隱式上下文和相關查詢; 此外,它可以為用戶提供有用的信息。
讓我們看一個例子(同樣由谷歌製作):我喜歡爬山,我最近爬過一座山,亞當斯山。 明年秋天我想徒步富士山,所以我想知道如何做不同的事情來為這次新體驗做好準備。 現在,我必須在搜索引擎上進行大量搜索,例如:
- 每座山的海拔;
- 平均溫度;
- 遠足路徑的難度;
- 使用正確的裝備;
- 等等。
經過大量搜索後,我設法獲得了我需要的所有信息。
現在,讓我們看看 MUM 會發生什麼。
媽媽可以理解我做了什麼,我需要做什麼。
媽媽可能會理解我在比較兩座山,猜測高度和步道信息可能是相關的。
它還可以理解,在徒步旅行的背景下,“準備”可以包括培訓等方面,以及合適的設備。 它還可以提取有用的相關信息並提出建議。
由於 MUM 可以根據其對世界的深入了解提出見解,因此可以強調雖然兩座山的海拔大致相同,但秋季是富士山的雨季,因此您可能需要一件防水夾克。 MUM 還可以展示有用的子主題以進行更深入的探索——例如最受好評的裝備或最佳訓練練習——並提供來自網絡上有用的文章、視頻和圖像的指針。
另一個重要的好處是消除了語言障礙。
語言是獲取信息的重要障礙。 MUM 可以通過不分語言地傳遞知識來打破這些障礙。
它可以從與搜索查詢使用不同語言編寫的資源中“學習”,並幫助用戶獲得答案。
以富士山為例,假設網絡上有用日語寫的富士山有用信息; 到目前為止,我可能不會通過搜索其他語言找到它們。
MUM 可以從所有語言的來源轉移知識,並使用這些信息以我的語言找到最相關的結果。
因此,以後在搜索有關富士山的信息時,您可能會看到諸如可以欣賞山景的最佳地點、該地區的溫泉和受歡迎的紀念品商店等結果——所有這些信息在搜索時更常見日本人。
[案例研究] 管理 Google 的機器人抓取
媽媽和疫苗研究
MUM 的第一個應用是改進疫苗研究。
我們都知道,同一個概念通常可以用不同的術語來定義。 這可能取決於語言、文化或地理區域,或多種因素的組合。
在大流行期間,人們開始在谷歌上尋找與 COVID-19 相關的信息,而谷歌必須學會識別用戶的表達方式,以確保它提供來自受信任的衛生當局(如世界衛生組織)的高質量信息。
根據谷歌的分析,阿斯利康、CoronaVac、Moderna、輝瑞、人造衛星和其他疫苗在全球可能有不同的名稱——超過 800 種。 尋找疫苗信息的人可以搜索,例如“Coronavaccin Pfizer”、“mRNA-1273”、“CoVaccine”等。
正確識別所有名稱的能力對於為人們提供最新可靠信息的結果非常重要,但此操作通常需要很長時間(數小時或數週)。 多虧了 MUM,才有可能在幾秒鐘內識別出 50 多種語言的 800 多種疫苗名稱變體。 MUM 只有一小部分官方疫苗名稱樣本,很快就發現了語言之間的差異。
這是一個很好的測試來展示新算法的潛力。 很容易想到,在不久的將來, MUM 的新技術將能夠提高用戶對所有搜索查詢的多語言搜索的相關性。
來自 Search On 2021 的最新消息
谷歌在一場名為“搜索”的直播活動中宣布了一些創新——這要歸功於人工智能——我們將在未來幾個月內看到谷歌產品。
第一條新聞是關於一種按圖像搜索的新方法,它將直接集成到 Google Lens中。 它將允許用戶搜索他們正在查看的內容,不僅通過基於谷歌圖片進行搜索,還可以通過對通過谷歌鏡頭拍攝的內容提出問題。
有了這個新功能,當查看 T 恤的照片時,可以觸摸鏡頭圖標,並要求谷歌在另一件衣服(例如襪子)上找到相同的型號或設計。 當您正在尋找可能難以用文字準確描述的內容時,這很有用:通過在單個查詢中組合圖像和文本,可以更輕鬆地通過圖像進行搜索並提出精確的問題。
另一個例子是拍攝一隻鳥,然後問鏡頭“它在吃什麼?” 或拍攝自行車的鏈條並詢問“我該如何修理它?”
第二條新聞是關於“你應該知道的事情”,即隱藏在搜索下的相關主題。
舉個例子,如果您搜索“丙烯酸塗料”,Google 將分析用戶如何處理該主題並將搜索相互關聯,提供多達 350 個有關丙烯酸塗料的主題。
例如,您將能夠瀏覽和發現諸如“使用家用工具製作丙烯酸塗料”等主題,從而使您可以更深入地研究該主題。 然後你可以“放大”或縮小,去了解更多關於在哪裡學習繪畫,或各種繪畫方法或著名畫家。
第三條新聞是關於視頻和視頻主題的分析。
谷歌不僅會分析視頻以發現亮點(它已經這樣做了),而且現在它將提供一種新的體驗,可以識別視頻的主題並提供鏈接,讓您可以更深入地導航和了解更多信息。
感謝 MUM,由於對信息的深入理解,相關主題將顯示,甚至視頻中沒有特別提及。
這些消息將在未來幾週內到達,並將在接下來的幾個月內得到改善。
結論
該系統將在未來幾個月或幾年內集成到不同的產品中。
MUM 不僅有可能改進現有系統的許多方面,而且還可以創造全新的方式來搜索和探索信息。
這是邁向 Google 可以理解人們自然交流和解釋信息的所有不同方式的未來的一大步。
我發現最令人難以置信的是無論語言如何都能搜索概念的能力。 我相信響應的質量,特別是對於非常具體的查詢,將顯著提高。
SEO工作將如何變化? 許多人想知道,面對算法對內容的不斷增長的理解,SEO是否仍然有意義。 我相信,人工智能在理解文本方面的改進越多,SEO 就越能夠擺脫邊緣技術的負擔,專注於生產非凡的資源,定義在精確的實體上,並且完全連貫和相互關聯。
這就是我期待的SEO。