多語言和國際 SEO:指南和案例研究

已發表: 2021-09-06

多語言 SEO 正在針對多種語言和多個地區優化網站的 SEO 流程。 多語言 SEO 專注於網站的不同部分,或品牌實體針對不同地區和語言的多個域。 它包括技術 SEO、語義 SEO、本地 SEO、內容相關指標和上下文搜索原則。 由於多語言網站更大、成本更高,但對搜索引擎用戶來說信息量也更多,因此搜索引擎對多語言網站的看法側重於跨語言文檔檢索的分類質量、主題權威和成本。

GSC performance graphic
ForexSuggest.com 是多語言 SEO 指南和案例研究的主要示例。 它有大量的技術 SEO 問題,但通過關鍵更改,它仍然能夠從 2021 年夏季贏得 Google 的兩個廣泛的核心算法更新。在接下來的部分中,您將看到從 9 月開始更新的 GSC 性能圖形。

談到多語言搜索引擎優化,大多數搜索引擎優化只關注hreflangs,或者,如果他們更小心一點,他們也關注URL模式。 但是,實際上,對於國際和多語言搜索引擎優化,搜索引擎可以關注的事情還有很多。 搜索引擎可以使用跨國網站來提高其語言理解、命名實體識別和相關算法、同義詞提取和查詢擴展過程以及 SERP 質量。 此外,多語言網站可以利用搜索引擎的這種興趣來增強自己在 SERP 上的權威和存在。

article by Danny Sullivan from 2011
Danny Sullivan 於 2011 年發表的一篇文章展示了跨語言信息檢索的重要性,同年 Google 發布的一篇文章展示了多語言網站的重要性。

在這個 SEO 案例研究中,一個甚至大部分時間都不使用“www”版本響應的網站將被證明從 2021 年夏季開始贏得兩個不同的廣泛核心算法更新。

“通過為 ForexSuggest.com 上最受歡迎和最重要的部分實施 hreflangs,並使不同語言部分在設計和內容數量方面更加一致,我們通過多語言 SEO 提高了我們的有機可見度。”

路易斯·舒曼

SEO案例研究的背景和介紹

這些多語言 SEO 指南和案例研究將說明搜索引擎的觀點、多語言網站的廣泛吸引力優勢、hreflang 標籤的重要性及其有效性,以及不同網頁部分之間的對稱性,使用 ForexSuggest.com 和41 種不同語言作為SEO案例研究。

ForexSuggest.com SEO 案例研究的結果如下。

  • 六個月內自然流量增加 435%
  • 展示次數增加 164%
  • 157% 活躍頁面增加
  • 新查詢數增加 58%
  • 點擊率增加 72%

在這個 SEO 案例研究中,ForexSuggest.com 發布了比競爭對手更多的新內容。 憑藉跨語言和跨區域的內容、上下文內部鏈接和設計一致性,儘管存在大量技術 SEO 錯誤和不對稱內容以及多語言網站問題,但它還是通過贏得 Google 的 2 次廣泛核心算法更新而蓬勃發展,在 2021 年夏天。

Last 220 Days Comparison of ForexSuggest.com
ForexSuggest.com 的過去 220 天比較。

ForexSuggest.com 項目的技術 SEO 錯誤和一般外觀是什麼?

ForexSuggest.com 有各種可能的技術 SEO 錯誤,包括沒有響應每個來源名稱的變體,例如“www”。 下面,您將看到網站上技術 SEO 錯誤的一般背景。

  1. 數以千計的規範化和重複內容錯誤
  2. 數百頁內容薄而不足
  3. 這些瘦內容頁面中的一些被認為是軟 404
  4. 數以萬計的內部重定向
  5. 數以萬計的“抓取未編入索引”的 URL 是質量問題的信號。
  6. 數百頁 404 頁
  7. 數千個內部 404 鏈接
  8. 數百個已發現但未編入索引的頁面,這在搜索引擎眼中是質量和技術問題的信號
  9. 結構化數據解析和屬性錯誤,收益
  10. 站點地圖中的 404 個 URL
  11. 一半的網站不在站點地圖中
  12. 站點地圖中沒有索引的 URL
  13. 缺少規範
  14. 缺少 Web 安全響應標頭
  15. 數百個500級錯誤
  16. 數百個索引但被阻止的錯誤
  17. 99% 的網站未能通過 Core Web Vitals
  18. 沒有響應版本“www”
  19. 數千頁的混合內容錯誤
  20. 該網站沒有用於尾部斜杠或大寫小寫字母的 URL 合併
  21. 80% 的分頁有缺陷。
  22. 有數百個內部nofollow
  23. 缺少 HTML 大小、未使用的代碼量或任何類型的 PageSpeed 和爬網效率優化
  24. 多個 H1 one 標籤,或沒有適當的可訪問性標題層次結構

Excluded Section of ForexSuggest.com from GSC
Google Search Console 中 ForexSuggest.com 的排除部分的一般視圖。 實際的錯誤計數比圖像中的要高得多。

除了技術方面的 SEO 問題外,多語言 SEO 方面也存在與內容相關的問題,例如不對稱的網站結構、大量未翻譯的內容、移動的錨文本或網頁設計和佈局。 老實說,直到現在,我什至沒有告訴多語言 SEO 案例研究網站的 40% 的一般 SEO 問題。 我想談談與 AMP 相關的問題,例如無效的 AMP HTML 結構和空白打開的 AMP URL,例如:“https://forexsuggest.com/fr/examen-infinox/amp/”。

organic search performance change graphic for ForexSuggest.com
ForexSuggest.com 過去 6 個月的自然搜索性能變化圖。 在這幾個月裡,發生了 5 次未確認的 Google 更新、兩次廣泛的核心算法更新、一次垃圾郵件更新、一次 PageSpeed 和頁面體驗更新。

但是,我告訴我的 Oncrawl 朋友讓這篇文章保持簡短,正如你已經註意到的那樣,我一如既往地失敗了。 但是,如果您想了解有關多語言 SEO 概念的更多信息,並且如果您對搜索引擎、它們的結構、決策樹和生態系統有深入的了解,請閱讀多語言 SEO 指南和案例研究的長版以了解更多概念,觀點和深刻的理解。

AMP Test Example
來自 Google 的 ForexSuggest.com 的 AMP 驗證工具的 AMP 測試示例及其結果。

除非你對搜索引擎有相當的了解,否則你應該閱讀我用 Oncrawl 為你準備的這個簡短版本,而不是長版本。

empty AMP URL 網站的空 AMP URL 沉澱示例。

最後,我需要提到該網站有很多垃圾郵件有害的外部鏈接,並且還沒有適當的拒絕文件嗎? 因此,從 SEO 的各個角度來看,該網站都有很多問題,但它仍然能夠通過每兩個月將流量翻一番來贏得每次 Google 更新。


當我看到所有這些技術和非技術問題時,我感覺就像 Izzi Smith 為 SEO 創作的精彩 GIF。

此多語言 SEO 案例研究的決策和優先級排序過程

ForexSuggest SEO 案例研究也是一個很好的例子,讓 SEO 決定在正確的問題上花費資源,以提高搜索引擎的整體網站質量、清晰度和可理解性,從而贏得廣泛的核心算法更新。 在內容部分,大部分內容是我開始做項目時發布的,並且一直在繼續發布。

crawl output from Bing Webmaster Tools
這是 ForexSuggest.com 的 Bing 網站管理員工具的示例爬網輸出。 而且,特別是 HTML Size 太長,錯誤會導致部分索引、部分緩存,同時使搜索引擎的 HTML Digestion 變得更加困難。

為了保持國際 SEO 指南的整潔,我將給出我使用的決策樹以及可能的改進,以便從一開始就以最佳效率使用所有勞動力。

  1. 我沒有專注於技術 SEO 問題,因為解決這些問題需要 20 人的團隊幾個月。
  2. 我沒有關注內容的問題,因為項目所有者已經在過去的內容上投入了大量資金,我所能做的就是給作家們提供培訓和建議,通過降低發布頻率來保持內容髮布頻率高於競爭對手。不同語言部分之間的不對稱性。
  3. 該網站展示其潛力基本上有兩個優勢,多語言使其在搜索引擎中比其競爭對手更重要。 第二個優勢是廣泛的吸引力。
  4. 為了利用這兩個優勢,我必須關注多語言 SEO 的四個主要概念。
  1. 不同語言部分之間的對稱性,在內部鏈接、錨文本、內容量方面。
  2. 不同語言部分之間在設計、網頁佈局、組件、品牌標識、品牌顏色方面的一致性。
  3. 在內容配置文件、標題-文本對和 URL 計數方面匹配不同的語言部分。
  4. 優先考慮規範版本、熱門話題和流行語言。

優先級、對稱性、可匹配性和一致性是本多語言 SEO 案例研究和國際 SEO 指南的主要原則。
在接下來的部分中,20 點將根據這些原則從搜索引擎的角度為多語言網站解釋國際 SEO 的注意事項和理解。

Statista Language Usage statistics for web users
網絡用戶的 Statista 語言使用統計。

1.了解多語言網站規範版本的價值

該網站的規範版本是具有規範語言的網站。 多語言網站的主要目標受眾是來自規範版本的位置和語言的受眾。 這是多語言網站上常見的錯誤之一。

請記住,完整的目標受眾是網站多樣化語言和區域部分的目標受眾。 但是,必須通過網站的內容來滿足主要目標受眾的需求。 這可以通過點擊滿意度來衡量,以便搜索引擎可以在跨語言信息檢索和跨語言索引和排名中信任相同的來源。

CTR and Average Position
對於規範版本,點擊率和平均排名遠高於替代版本。 在我們的例子中,它是南非。

對於多語言網站,可以在下面找到規範版本應遵循的內容。

  1. 內容髮布頻率和大小:網站的規範版本應優先考慮內容髮布頻率和將提供的信息量。
  2. 鏈接流向:規範版本應該比替代版本有更多指向它的內部鏈接。
  3. 對稱:多語言網站的規範版本和多語言網站的替代版本應該具有彼此對稱的結構。
  4. 審核:規範版本應優先考慮內容、用戶體驗、網頁佈局或頁面加載性能優化方面的相關性和質量審核。

language distribution for content on the web
網絡內容的語言分佈。

多語種網站和規範版本的話題權威效應

與替代版本的類似問題相比,規範版本上的質量、不相關或主題覆蓋差距和不全面的內容可能對多語言網站的主題權威造成更大的損害。 借助語義 SEO,借助歷史數據,通過正確的內容結構覆蓋每個相關實體、屬性、可能的搜索活動和相關搜索意圖,成為行業的主題權威或主題是可能的。 基於此,多語言網站可以通過語義 SEO 與語言無關的特性來增加其主題權威。


Lindsey Wiebe(紐約時報的 SEO 經理)為 Google 的 John Mueller 提出的 Google 搜索問題,展示了搜索引擎對不同語言的看法,以及新聞 SEO 的地理位置和熱門輪播選擇。

使用跨語言的綜合內容網絡覆蓋主題將為具有預定義質量分配的源生成更好、更多的歷史數據和主題權威……要了解什麼是主題權威以及如何將其用於 SEO,您可以閱讀相關的 SEO指導和案例研究。

Website quality signal generation
谷歌“網站質量信號生成”專利中的一段。

2.使用一致的內部鏈接結構和鏈接流程

鏈接流是網頁之間鏈接的方向和強度。 多語言網站的規範版本和替代版本之間一致的內部鏈接結構包括相同的站點樹和對稱的站點結構。 如果多語言網站的內部鏈接結構和內部鏈接流行度與另一個替代版本不同,這可能會在不同語言和區域部分之間創建不對稱的網站結構。

ForexSuggest Multilingual SEO Project
這是 ForexSuggest 多語言 SEO 項目 9 月 4 日的屏幕截圖。

在搜索引擎的站點樹和爬網路徑方面具有不一致的替代版本可能會使爬網過程更加困難,因此基於概念、短語和意圖將不同的網頁或部分相互關聯起來成本會更高。

Same Internal Link Structure
每個語言部分的主頁具有相同的內部鏈接結構和設計。

使用相同的內部鏈接結構和替代之間相同的鏈接流程設計將為搜索引擎創建一致、清晰的相關性、上下文和爬取路徑,並為用戶創建良好的導航路徑。

當涉及到主頁時,替代版本和規範版本之間的一致鏈接結構更為重要。

  1. 對跨語言部分使用相同的內部鏈接結構。
  2. 使用相同的鏈接流和方向,不同部分的流行度。
  3. 鏈接規範版本多於替代版本。

ForexSuggest.com’s Performance Report from Bing Search Engine
這是來自 Bing 搜索引擎的 ForexSuggest.com 過去 6 個月的績效報告。 我還將在未來的 SEO 案例研究中包含 Bing 的性能報告。 而且,在夏季,我們還可以看出 Bing 會執行自己的更新,自然搜索性能的提升也適用於 Bing Search。

4. 跨語言使用一致相似的錨文本

搜索引擎處理鏈接文本以了解鏈接的目的以及鏈接源網頁和鏈接目標網頁之間的關係。 與使用一致的內部鏈接結構一樣,跨語言使用對稱錨文本也很重要。 如果從頁面“A”到頁面“B”,您使用 C 作為鏈接文本,對於另一種語言,您應該使用“C”最接近的翻譯作為鏈接文本。

想像一下,你是一個搜索引擎,你嘗試爬取和理解一個多語言網站,你會發現它比單語言網站成本更高,因為它要大得多,而且跨語言、歷史數據等的相關查詢更多排名和質量信號。 在這種情況下,如果您將“兒童床”網頁中的“兒童床”網頁與“兒童床價格”的鏈接文本鏈接,並且對於另一種替代語言和版本,如果您使用“兒童睡眠”的錨文本對於相同的頁面,這種不一致會削弱網頁及其替代頁面的相關性和上下文。

internal link popularity
在內鏈流行度上,多語種網站的不對稱性有所好轉,但仍是最流行的,國際網站的規範版本並沒有得到適當的優先級。

使用相同的鏈接結構、鏈接流向、與鏈接文本的流行度分佈將使對稱替代版本與規範版本的爬行、理解和匹配。

最後,要查看多語言網站的主要語言,搜索引擎可以比較跨語言錨文本及其數量。 因此,優先考慮規範版本對於以跨語言方式使用錨文本也很重要。 並且,確保翻譯後的規範標籤將保護其與鏈接源網頁的標題、標題和目標網頁的標題以及標題的相關性,即使您翻譯它們也是如此。 因此,這不僅僅是一個翻譯過程。 就錨文本的含義而言,翻譯後的內容還應按原樣包含錨文本。

  1. 使用與其含義一致的錨文本。
  2. 翻譯所有的錨文本。
  3. 跨語言創建相同的相關性和導航方向。
  4. 按原樣翻譯標題和標題,並確保錨文本作為跨語言存在於目標內容中。
  5. 優先使用錨文本的規範版本。

external references
外部參考文獻中的大多數錨文本都是英文的。 對於一個成功的多語言網站,針對每個基於用戶的信號使用受眾多樣化也很重要。

5. 無一例外地翻譯所有內容

了解網站和網頁內容的語言可能會給搜索引擎帶來問題。 例如,如果一個網站有 500 個網頁,其中 250 個是英文,50 個是德文,200 個是法文,這會使搜索引擎混淆以下問題。

  1. 這個網站的規範版本是什麼?
  2. 這個多語言網站的主要目標受眾是什麼?
  3. 這些內容是等價的嗎?
  4. 它是否以相同的不同語言發布相同主題的內容?
  5. 他們是否同時為法國、美國、新西蘭、加拿大、英國、土耳其提供服務?
  6. 哪個內容可以匹配哪個?
  7. 是否有 hreflang 信號,是否正確使用?
  8. 是否有 URL 細分?
  9. 就內部鏈接而言,哪個部分更受歡迎?
  10. 他們從哪裡獲得更多鏈接? 來自英國還是美國?
  11. 他們的錨文本的主要語言是什麼?
  12. 本地化版本是否有地址、電話號碼或創始人信息?
  13. 他們在社交媒體和合作部分使用哪種語言?
  14. 規範版本的 IP 地址、DNS 區域是什麼?

除了這些問題之外,搜索引擎還有更多問題,但對於這個多語言 SEO 指南的簡短版本,這些就足夠了。 為了了解多語言網站的主要身份和服務區域,搜索引擎會檢查主頁的語言和錨文本的語言。 但是,如果替代版本翻譯得不夠充分,就會造成跨語言質量下降。

Augmenting queries with synonyms selected using language statistics
來自 Google 的“使用語言統計選擇同義詞增強查詢”專利的架構。

在某些情況下,Web 上的某些來源在樣板內容中使用未翻譯的內容,例如側邊欄、頁眉和頁腳。 多語言網站應同時翻譯樣板和主要內容。 該特定部分的主要語言,無論是子域或子文件夾,還是單獨的域,都應完全用於網頁的每一英寸。

搜索引擎將更關心可見內容、可見鏈接、文本和視覺元素來確定網頁的語言,因此使用清晰的設計和視覺信號很重要。

  1. 翻譯樣板內容。
  2. 翻譯主要內容。
  3. 翻譯口號、座右銘、小節。
  4. 除非有正當的文化原因,否則無一例外地翻譯所有不同的網站部分。

[案例研究] 通過頁面 SEO 推動新市場的增長

當 Springly 開始考慮向北美市場擴張時,頁面 SEO 已被確定為在新市場成功起步的關鍵之一。 了解如何通過技術 SEO 為您的內容策略從 0 到成功。
閱讀案例研究

6. 與本地作者和團隊一起審核翻譯質量

SEO 無法了解所有語言,但在多語言 SEO 項目中,您需要管理您實際上並不了解的語言的 SEO 性能。 技術 SEO 與語言無關。 換句話說,它適用於具有相同方法的每種語言。 但是,多語言搜索引擎優化是基於語言差異。 因此,審核網站內容的質量對於外語來說可能並不容易理解。

Google’s Automatically Generated Content
Google 自動生成的內容中的一個部分。

在這種情況下,替代版本的語言應該由當地團隊審核,或者作者和審核員應該是互不認識的不同人。 如果一個語言和替代版本的翻譯質量不夠,非質量內容也會影響替代版本的主題權威、分類質量和相關性。

  1. 與母語人士一起審核不同的語言內容。
  2. 就您的 SEO 觀點和策略對母語人士進行教育。
  3. 審計員和作者不應該互相認識。
  4. 如有必要,與其他審核員一起審核審核員。

Page Experience report of the ForexSuggest.com
ForexSuggest.com 頁面體驗報告的一般視圖。

7. 本地化規範部分的替代版本

多語言非對稱網站在某些語言中的 SEO 性能可能較差,從而難以抓取和匹配相關部分。 但是,由於地區和文化差異,多語言網站的某些部分可能是不對稱的。

內容本地化對於保持多語言網站的每個部分的相關性和可能的​​相關搜索活動的質量非常重要。 內容本地化是根據當地文化和語言為受眾優化網頁內容。 因此,某些網頁可能未翻譯成某種語言,或者在某些情況下網頁可能包含額外的部分。

Cross-language Search Patent
Google 的“跨語言搜索專利”部分。 對於本地連接,有兩種不同類型的實體,本地實體和遠程實體。 對於單語網站,實體可以是遠程的,但對於有組織的多語言網站,來自同一主題的實體可以是本地的,並且更相關。

但是,網站不可能通過此類本地化示例達到不對稱點。 通過創建基於模板的內容,可以為國家名稱、城市名稱、地區名稱或其他命名實體及其屬性提供變位。 因此,在更新特定區域的內容時,也可以將其標記為替代。 與本地化替代版本相關的一些註釋如下。

  1. 使用內容本地化來提高替代版本的質量和相關性。
  2. 如果它對某個地區或文化沒有意義,請不要翻譯它。
  3. 盡量使本地化內容與基於模板的內容保持對稱。

Cross-language search
跨語言查詢評估模塊,谷歌“跨語言搜索”專利的一部分。

8.永遠不要跳過hreflang的使用

Hreflang 是一個相關的多語言 SEO 標籤,介於網頁的替代版本和規範版本之間。 Hreflang 可以幫助搜索引擎進行更好的網頁探索、替代版本匹配,並在它們之間共享 PageRank、質量和相關性信號。

因此,hreflang 不僅僅是匹配備選方案,它還通過幫助搜索引擎以更簡單的方式抓取網站來共享質量、相關性和權威信號。 因此,內容對稱和完整的翻譯很重要。 如果網頁沒有規範版本的一半內容,則搜索引擎可以忽略 hreflang,因為它包含缺失和不一致的信號。

Identifying relevant document languages through link context
谷歌“通過鏈接上下文識別相關文檔語言”專利。 多語言搜索引擎優化的語言轉換按鈕的重要性也可以從這個模式中看出。

Hreflangs 是多語言 SEO 的一部分,但不是多語言和國際 SEO 的全部。 但作為多語言 SEO 策略的一部分,應使用具有 ISO 639-1 代碼的語言和具有 ISO 3166-1 代碼的區域的 hreflang 標籤。

  1. 從一開始就使用hreflangs。
  2. 不要將相對 URL 與 hreflangs 一起使用。
  3. 為所有替代版本添加 hreflang。
  4. 在 hreflang 標記中使用正確的語言和區域格式。
  5. 如果您從一開始就沒有使用過hreflangs,請檢查添加hreflangs 後的平均位置變化,以及備用查詢計數的變化。

將 hreflangs 添加到 ForexSuggest.com 多語言 SEO 項目後,自然點擊量增加了約 100%。 這種增長因地區而異:對於某些地區來說,它是更好的,而對於某些地區來說,它是較小的。

internal linking
不同部分之間的內部鏈接和語言更改按鈕應始終可見。

9.使用CDN服務器或多個本地服務器

搜索引擎可以檢查網站的 DNS 區域和 IP 地址,以查看網站的位置並將其與目標受眾相關聯。 為多語言和多區域網站使用單個服務器位置可能會導致難以標記網站的替代部分並將替代部分與目標受眾匹配。 使用本地服務器不僅有助於將網站的每個部分與不同的地區和語言進行匹配,而且可以使在相關地區使用相關語言的用戶更快地訪問網站。

Total Content Length
替代版本的總內容長度,以及規範版本及其在多語言網站總內容長度中的百分比。

為每個區域和語言使用單獨的服務器可以減少多語言網站的首字節時間。 這將有利於直接來自不同地區的搜索引擎爬蟲爬取您的網站,而頁面體驗的改善將直接或間接地為 SEO 做出貢獻。

  1. 為每種語言和地區使用本地 IP 地址和 DNS qone
  2. 為多語言和區域受眾使用多台服務器

在 ForexSuggest.com 項目期間,對於每種語言和區域,都使用本地區域的不同服務器、數據庫和 WordPress 設置,並具有本地化 IP 。 我對此的推理也是基於經驗:在過去,我遇到過波蘭網站由於烏克蘭 IP 地址而主要從烏克蘭吸引流量的情況。 即使搜索引擎可以在以後解決這些問題,從一開始就給出一致和明確的信號將使網站的排名隨著時間的推移而提高。

content amount and content length
不同部分的內容量和內容長度的餅圖。

10. 在不同部分使用一致的設計、品牌顏色、標識和網頁佈局

網站每個 URL 的一致品牌標識以及可用性模式、顏色、網頁佈局有助於提供一致的視覺傳達。 這減少了用戶的學習時間並提高了搜索引擎的置信度,防止他們感知無機網站結構。無機網站結構是一種複雜的結構,不會跨不同的子域、不同的域或子文件夾集成。 設計更改或徽標更改以及網頁佈局更改可以更改網頁的含義、上下文和可用性。

由於多台服務器或多個前端、後端和作者、設計團隊,多語言和多區域網站可以具有無機站點結構。 如果網站的品牌標誌、基線、地址、電話號碼、網頁佈局、顏色和排版發生變化,將會使眼球追踪和品牌塑造變得更加困難,同時讓搜索引擎認為該網站不屬於單一品牌實體。

extracted anchor texts
由於 HTML 損壞,提取的錨文本不是最佳形狀,而是語言轉換按鈕,並且可以按語義順序看到其內部鏈接。 儘管如此,“閱讀評論”和其他類型的“非上下文”錨文本。

要了解無機站點結構的問題,您可以使用 Bing 的指南來解釋它是什麼以及為什麼應該避免它。 在 2017 年之前,許多網站所有者將其子域或子文件夾出租給其他品牌。 由於權威的頂級域名更容易排名,人們租用這些網站的部分用於他們自己的主題或品牌。 此外,在黑帽行業中,即使子域屬於主域,也會使用不同設計的子域來引導 PageRank 的外部流量。 換句話說,如果設計、主題和身份不同,搜索引擎就會認為它實際上是一個不同的網站。 然而,這種做法今天在一定程度上仍在繼續。

Relative Frequency
使用 Google 的語言統計專利選擇的同義詞增強查詢。 Google 可以使用“相對頻率”來選擇來源的點擊滿意度可能性,以及與其他國家/地區的本地相關性……

因此,使用一致的設計、網頁佈局、徽標、品牌名稱、品牌基線、本地化地址、排版和 Web 組件放置對於使多語言網站保持一致非常重要。 這種一致性也使用戶在可用性方面的語言轉換更加順暢。

  • 對每個子部分使用相同的設計、顏色和視覺元素。
  • 對每個子部分使用相同的徽標、品牌名稱、品牌格言、品牌顏色。
  • 對每個子部分使用相同的網頁佈局、網頁組件和位置。

在 ForexSuggest.com SEO 案例研究中,大多數網站的主頁等重要部分的設計相同,但在某些部分中,設計和可用性模式也不同,應該加以修正。

Danny Sullivan’s article
在 Danny Sullivan 的跨語言信息檢索文章和 Google 的“語言障礙消除”公告 10 年後,Google 開始翻譯文檔以縮小語言之間的信息差距,以滿足來自其他國家和語言的查詢。 這也是一個信號,說明了為什麼 SEO 應該考慮讓他們的網站多語言化。

11. 使用多個站點地圖和單獨的 Google Search Console 帳戶使分析更容易

使用多個站點地圖有助於分析 Google Search Console 的不同部分的覆蓋率報告。 如果一個多語言網站有 41 種或更多不同的語言,則在有機流量、用戶行為、轉換或索引以及技術 SEO 方面分析每個網頁部分的不同語言需要高水平的數據過濾。 Filtering and grouping all of the URLs from the beginning via different and segmented sitemaps are useful to make data analysis easier for SEO.

errored sitemaps
The errored sitemaps can be seen for the ForexSuggest.com from both of the Google Search Console and Bing Webmaster Tools.

Data analysis and data science is an important part for SEO. Part of this process is data preparation, and examining the right part of the data at each step. Another part of this process is visualization. I will show some examples of visualization later, but if you want to learn more about Data Science, and Visualization for SEO, you can read related guidelines.

Google Question Hub
Google Question Hub is about satisfying the questions that are not answered on the web. A question might be answered for a language, but might not be answered for another one. In this context, Question Hub, and Cross-lingual Information retrieval, crawling, indexing, and query expansion are connected to each other.

When preparing data, segmenting the available data according to the axes you will want to analyze is an important step. Thus, segmenting sitemaps is important as creating different Google Search Consoles for different subsections. Different GSC account setups for every different language section of a multilingual and international website are useful to make organic search performance, Page Experience Report, and Links report analysis easier.

45 different sitemaps
There are 45 different sitemaps for this multilingual SEO Case Study, and the asymmetry and topical coverage differences can be seen clearly.

Having multiple but smaller sitemaps can help a search engine to download the sitemap more frequently for crawling and refreshing purposes. In news SEO, smaller sitemaps for similar site segments usually help to increase the count of indexed web pages. A multilingual website can also use smaller and multiple sitemap counts for the same purposes.

  1. Use different Google Search Console accounts for every language and region section.
  2. Use different sitemaps for every language and region section.
  3. Make the sitemap files smaller if it is possible, and use different sitemaps, and GSC accounts for data analysis.

coverage report
For every sub-section or language-based subfolder of the multilingual website, examining the coverage report will be more efficient.

12. Understand the value of multilingual and regional websites for search engines

Multiregional and multilingual websites are valuable for search engines to perform query expansion for cross-lingual information retrieval and indexing.

gender related bias
A research paper publication from Google related to the gender related bias within the open web that affects the NLP and NLU. Google talks translating content on Wikipedia without any gender bias by explaining the language based structural differences, and it includes cultural differences too.

The goal of cross-lingual information retrieval is to understand multiple languages for a topic by recognizing entities, understanding sentence structures, and matching the synonyms. The second value of multilingual websites for a search engine is that they satisfy users for multiple languages for the same topic. Instead of crawling, rendering, understanding, evaluating, indexing, and ranking 10 different sources from the web, a search engine can choose one source with “broad appeal” for a topic with multiple languages. Quality multilingual websites help a search engine to understand a topic in a better way by examining the queries from different languages, and satisfy more users from different cultures and segments.

improved organic search performance for all regions
This is another example for entirely another industry. The main difference is that the most important sections are translated into the other languages. And, e-commerce and informational web pages improved organic search performance for all regions together.

The third value of multilingual websites for a search engine is that they help search engines to find quality documents for other languages by clustering. A search engine can find a quality document and then clusters similar other documents for the specific document. If a source is authoritative across languages for a topic, these documents can be used to predict the quality of new documents or new sources from these sources.

A short list of benefits and values of multilingual websites for search engines is listed below.

  1. Helps for query expansion
  2. Helps for cross-lingual information retrieval
  3. Helps for cross-lingual indexing and ranking
  4. Helps for cross-lingual synonym extraction
  5. Helps for cross-lingual quality evaluation for similar documents
  6. Helps for cross-lingual entity extraction, and natural language understanding

the change after the translation is reciprocal
The change for the different countries for the second example after the translation is reciprocal as expected. Every improved organic search performance for a country benefited the other organic search performance profiles for other countries as well.

13. Understand the cross-lingual indexing and ranking for search engines

Cross-lingual indexing and ranking is the process of comparative indexing and ranking across different languages based on different queries, entities, and possible search intents. With the help of semantic SEO, Google has started to understand entities in a language-agnostic way and to connect the questions and possible search activities to each other across languages.

The main obstacle of uniting all of the user data from around the world is that of creating a consistent list of synonyms and co-occurrence phrases for every contextual domain. Entities do not need language to be expressed or to exist, but users of web search engines need phrases to express their needs behind the query. Thus, cross-lingual indexing and ranking help a search engine to increase the SERP quality and documents' relevance for certain entities based on cross-lingual concepts.

cross-lingual indexing and ranking

A search engine can collect all of the n-grams, co-occurrent phrases, and entities from a multilingual website in a comparative way. Every entity will be processed with different phrases but also different angles from every geography. Winston Churchill is the victor of the Second World War for a British newspaper, but a newspaper from India can have a different attribute for the same entity. Thus, cross-lingual indexing and ranking will help a search engine to increase its confidence score for certain connections between phrases and entities by improving its knowledge graph full of facts between entities.

A research paper from 2018 in Google
A research paper from 2018 in Google. Daniel Vrandecic seeks methods to make information more available for different languages by translating Wikipedia articles to other languages by protecting objectivity. It is also a good research paper to see trust signals, and subjectivity perception of a search engine.

Cross-lingual indexing and ranking are possible with cross-lingual crawling and information retrieval. Google is a semantic search engine and semantically created sources with semantic information will thrive in SERP. Google is also a multilingual search engine. A multilingual website will have the benefit of aligning its own features and structure with the search engine.

topical authority
Creating a topical authority for a source for a language is useful, but doing the same thing across different languages is more useful, and it will make the source more valuable.

  1. 查詢擴展是將查詢翻譯成另一種語言以檢索高質量文檔的過程,目的是從原始查詢語言的相似來源中找到最相似的文檔。
  2. 跨語言索引可以幫助搜索引擎統一跨語言的用戶數據和反饋,以生成更令人滿意的質量檢測算法。
  3. 多語言搜索引擎有自己的翻譯器,如果文檔語言與設備、操作系統(操作系統)或瀏覽器的語言不同,它們允許用戶使用文檔的翻譯版本。
  4. Google 將原始查詢語言稱為“源語言”,並將原始查詢稱為“源查詢”。
  5. 有些查詢對於所有語言都是相互的,因此語言檢測可能很困難。 對於這些查詢,谷歌提供了一個跨語言的 SERP 實例。 谷歌稱之為“跨語言搜索”。
  6. Google 使用“Cross-Language Information Retrieval”的“CLIR”縮寫。
  7. 在文件中,搜索引擎意識到有爭議實體的語言之間存在偏差,因此具有權威、證據和 EAT 的來源將被 CLIR 系統優先考慮。

Google’s Cross-language search patent
來自 Google 的跨語言搜索專利的架構。

14. 使用具有外部參考、提及和聯繫的受眾多樣化

跨語言搜索的受眾多樣化和流行度在搜索引擎眼中是相互關聯的。 谷歌提到了“消除口頭查詢詞的歧義”、“為帖子作者評分”、“增強興趣點識別”、“顯示與設備上播放的內容相關的信息”的“流行度信號”。 谷歌可以將人氣作為衡量可靠性和質量的指南針。 受眾多樣化是通過鏈接、提及或視覺元素、訪問者使外部參考的 IP 地址多樣化的過程。 IP地址可以顯示用戶的位置,即使用戶試圖隱藏他/她的IP地址,谷歌也知道用戶的ISP(互聯網服務提供商)。 此外,Google DNS 服務器對於 Google 跟踪用戶的搜索字詞、訪問過的網站、甚至在網絡上聽過的歌曲或下載的電影很有用。

guess the geo-location of a user
根據谷歌專利中的用戶配置文件模式優化位置估計和反向地理編碼,以猜測用戶的地理位置。

對於多語言 SEO,考慮到跨語言的流行度、可靠性和質量信號,通過將所有信息點多樣化以與不同的地理區域、語言和用戶群相關是很重要的。

  1. 外部引用的多樣化IP地址
  2. 通過使跨語言的實際流量多樣化來多樣化流行信號
  3. 增加品牌跨語言導航查詢的搜索需求
  4. 使用跨語言的社交媒體來提高流行度信號

Dynamic Language Model” patent of Google
Google 可以根據流行度信號觸發不同類型的算法,無論是針對查詢還是跨語言來源,“Google 的“動態語言模型”專利”。

要了解有關受眾多樣化的更多信息,您可以閱讀其對新聞 SEO 的重要性。

[案例研究] 優化鏈接以改善具有最大投資回​​報率的頁面

在兩年的時間裡,RegionsJob 通過微調其網站的內部鏈接結構以創建高效的架構,解決了提高投資回報率的挑戰。 該策略集中在支持網站目標的 SEO 操作上。 基於頁面盈利能力的 KPI,RegionsJob 實施了一些修改,以創建一個具有更好用戶轉化率的網站。
閱讀案例研究

15.不要使用本地自適應網頁

本地自適應頁面是根據用戶的 IP 地址從另一個 URL 重定向到用戶,或者它可以根據瀏覽器、操作系統或設備的語言顯示不同的語言內容。 本地自適應頁面可以防止來源使用自己的主頁來歡迎搜索引擎爬蟲。 就理解最重要的內部鏈接、錨文本或來源的上下文和身份而言,來源最重要的網頁是其主頁。 因此,將搜索引擎爬蟲重定向到非主頁或具有本地自適應網頁的主頁替代頁面不是搜索引擎友好的溝通和實踐。

An announcement from Google for “locale-adaptive pages”
谷歌在 2018 年發布的“區域自適應頁面”及其抓取過程的公告。

將搜索引擎爬蟲和用戶重定向到基於不同 IP 的不同 URL 將削弱搜索引擎的置信度分數,以了解網頁與特定地理、語言以及搜索意圖、概念和短語的相關性。

  1. 根據不同的 IP 重定向到不同的 URL 會稀釋網頁的上下文,並且會導致更難理解網頁的原始內容。
  2. 當用戶嘗試登陸主頁時不要重定向用戶。 不要使用本地化主頁替代品而不是真實主頁。 在主頁上反映主要受眾的語言。
  3. 如果您阻止某個地理區域的用戶,也可以阻止這些特定區域的搜索引擎爬蟲。
  4. 與“單獨的區域設置 URL”的 URL 和內容結構保持一致。

最後,Google 通過更改其“Accept-Language”HTTP 標頭和 IP 地址來支持“地理分佈式抓取”和“語言相關抓取”,以查看網頁的實際內容。 谷歌支持本地自適應網頁在他們找到時在網絡上工作,但這並不意味著對於國際搜索引擎優化,從搜索引擎的角度來看,本地自適應頁面成本更高且更難理解。

visualization of the ForexSuggest.com’s URL pattern
這是 ForexSuggest.com 的不同語言部分的 URL 模式的可視化,以及它們在站點樹中的頻率。 不對稱結構可以在這裡看到。

16. 始終使用一致的主頁

在多語言和國際 SEO 中擁有跨不同網站語言的一致主頁非常重要,因為它反映了來源的身份和最重要的網站部分。 搜索引擎爬蟲在訪問 robots.txt 文件後立即訪問主頁。 不同替代語言之間的不一致主頁可能會削弱特定行業來源的身份、品牌形象和相關性。 網絡上有些資源沒有主頁,而是使用子目錄作為特定語言和地區的主頁。 這種情況會損害來源的清晰度,並切斷更好的 PageRank 分佈的潛力,通過主頁發出相關信號。

visualization example of the Hreflang Implementation
這是 ForexSuggest.com 的 Hreflang 實現的可視化示例。 可以很容易地看到優先部分、不對稱、延遲部分和一般缺失部分。

即使 SEO 項目使用動態渲染,將用戶和爬蟲重定向到不一致的不同 URL 也會損害來源的可靠性,以及搜索引擎通信的效率。 即使有一個 URL 更改的 SEO A/B 測試,使用 302 重定向,只有兩周是理想的持續時間。 兩週後,Bing 假設 302 重定向實際上打算用作 301 重定向; Google 認為 302 重定向保留時間過長是為了欺騙搜索引擎,但它沒有定義此特定算法觸發的確切持續時間。

URL Count for the Canonical English Version
規範英語版本和替代版本的 URL 計數及其百分比。

多語言搜索引擎優化的一致主頁的好處可以在下面找到。

  1. 提高PageRank分發效率
  2. 提高爬取效率
  3. 從主頁反映來源的身份和優先受眾
  4. 從主頁給出最重要的術語、n-gram、錨文本
  5. 向用戶和搜索引擎反映品牌的身份。
  6. 具有品牌知識面板的一致 URL。
  7. 為外部參考和自然流量提供更好的一致受眾多樣化。

17. 盡可能使用 UTF-8 編碼

UTF-8 使用單字節(8 位)系統對所有現有字符進行編碼,其中有 1,112,064 個字符。 官方互聯網號碼分配機構 (IANA) 使用 UTF-8 編碼。 此外,它是所有 CSS、HTML、XML 文檔、資源和 HTTP 標頭的標準。 因此,Google 更喜歡 UTF-8 以使抓取、索引、理解和排名過程更容易且成本更低。 由於多語言、多區域和國際 SEO 項目,域可以包含非 ASCII 字符和非 UTF-8 文檔、資源中的字母、文檔、標題或 URL(服務器上文檔的名稱和路徑) .

UTF-8
對於所有國際 SEO 案例研究主題網站,都使用 UTF-8。

對於結構化數據,如 UTF-8 編碼或其他類型的搜索引擎優化相關標籤,也可以看到搜索引擎的習慣。 對於 Schema 標記,Google 更喜歡 JSON-LD,因為從 JSON-LD 中理解和提取數據的成本低於微數據或 RDFa。 使用國際化域名可能有助於與主要目標受眾建立聯繫,但對於所有目標受眾來說,仍然可能難以理解。

要執行 ASCII 和非 ASCII 字符之間的轉換,搜索引擎可能需要使用 ToASCII 和 ToUnicode 類型的算法。 而且,任何額外的算法工作或理解或索引網站的階段,都會使國際 SEO 變得更加複雜。 以國際標準清晰易懂更有利於搜索引擎的感知,也有利於用戶的理解。

Identifying common co-occurring elements in lists
Google 的“Identifying common co-occuring elements in lists”專利中的一部分,用於在知識圖中進行實體消歧和實體信息擴展。

18.不要依賴語言和地區的HTML標籤

與語言和區域相關的 HTML 和元標記可用於定義 HTML 文檔的內容語言或其預期語言,以及要服務的地理位置。 Google 會忽略 HTML Lang 屬性和其他與區域相關的 HTML 標記,因為這些是網絡上使用最錯誤且一致性最差的信號。

response time for the Googlebot
多語言網站可以通過使用跨不同語言部分的語義站點結構來提高其爬取效率,無論是在 URL、麵包屑、語言轉換按鈕還是在 hreflang 中。 ForexSuggest.com 對 Googlebot 的響應時間為 869 毫秒,是 Google 建議的 4 倍以上。

大多數 HTML Lang 標籤來自網站的主題語言,而不是來自內容的語言,並且大多數網站所有者不知道如何使用或更改位置元標籤。 由於搜索引擎試圖通過將 SEO 的大部分“命令”轉化為“提示”來控製網站運營商和 SEO 對其自身內部系統的感知,因此忽略了多語言和區域 HTML 以及元標記由搜索引擎。

下面列出了一些區域元標記。

  1. HTML 語言屬性
  2. 地區、城市或國家名稱的“Geo.region”元標記。
  3. 帶有“;”的坐標的“Geo.position”元標記分隔器。
  4. 帶有“,”分隔符的坐標的“ICBM”元標記。

19. 審核多地區多語種的初排和再排流程

初始排名和重新排名是搜索引擎排名算法和過程的兩個階段。 初始排名是第一次對索引文檔進行排名的過程。 重新排名是修改 SERP 上現有文檔的排名的過程。 重新排序和初始排序過程可以通過相互的、重複的和始終在線的工作算法以及不同的和部分激活的算法來執行。

international SEO Project
對於這個國際 SEO 項目,我們至少有來自 241 個不同國家的印象。 在這種情況下,據我所知,我們只有 195 個國家,但谷歌有不同的視角來定義地球上的國家總數,以提高搜索結果的質量。

對於國際 SEO 項目,來源在某種語言的某些查詢中的排名可能高於其他語言,或者它在某些主題中的排名可能高於其他主題。 同樣的情況可能發生在不同的網站版塊、作者或其他類型的差異上,例如社交媒體共享、站點地圖中包含的 URL 或來自主頁的鏈接。 初始排序和重新排序過程會受到外部和內部鏈接的刪除、內部鏈接或錨文本的變化、來源的主題權威、查詢需求的增加或減少以及質量、可靠性、相關性信號的影響。

Re-ranking and Initial Ranking
在規範版本重要性背景下的重新排名和初始排名方面,由於規範版本在南非,其他靠近非洲的國家也有更好的平均排名,因為如果國際 SEO 位於 X 國家,它也可以與周邊國家和這些國家的觀眾有更多的聯繫。

在這種情況下,初始排名和重新排名過程觀察可用於國際和多語言 SEO,如下所示。

  1. 觀察新發佈內容​​的抓取延遲、索引延遲和初始排名。
  2. 使用所有相關性、突出性、可靠性和質量信號來使每個 URL 排名最初更高,例如所有索引信號、PageRank 共享機會以及具有上下文突出屬性的相關實體。
  3. 比較不同語言、主題、作者、URL 模式或麵包屑模式的初始排名。
  4. 使用 hreflang 使搜索引擎在語義上跨語言感知每個部分,以在不同版本之間共享質量和相關性信號,以獲得更好的初始排名。
  5. 從主頁的主要內容鏈接已發布的內容。
  6. 審核競爭對手的頁面以查找最初排名較低的頁面以查找模式。
  7. 等待重新排序過程的觸發因素、頻率及其方向。
  8. 審核搜索引擎如何根據“SERP 質量的信心”對頁面進行重新排名。
  9. 為競爭對手的站點地圖變化創建警報,並審核競爭對手的重新排名和初始排名過程,以了解他們對搜索引擎感知的權威和突出程度。

將來,我將發布一個新的 SEO 案例研究和新的指南,使用初始排名通過使用主題權威和語義 SEO,為網站的利益重新排名過程創造優勢。

boilerplate content’s translation
就樣板內容的翻譯,以及設計、錨文本的一致性而言,可以看到上面的例子。

20.為你的利基優先考慮流行的語言和受眾

對流行語言和受眾進行優先排序是對內容髮布進行優先排序,對最常用的語言進行更新頻率的過程,並創造歷史數據價值。 多語言網站的國際搜索引擎優化有不同的語言部分,每個部分都會為搜索引擎產生不同程度的價值。

鏈接價值主張是由搜索引擎為搜索引擎結果頁面選擇的來源提出的價值。 如果一個來源在已經給自己的鏈接(片段)的邊界內為 SERP 質量提供了價值,那麼搜索引擎將更有信心進一步對來源進行排名。 一個國際 SEO 項目不僅可以通過使用流行語言創建更多歷史數據來確保其在最初以及在重新排名過程中獲得更高排名的機會。

local relevance signals
如果您檢查頁腳設計比較,您應該意識到該網站使用盧森堡地址。 而且,由於南非規範信號,有許多非洲國家,我們還看到盧森堡的平均排名更好。 其中一些結果是由於競爭程度低,但其中一些是由於本地相關信號。

國際搜索引擎優化的內容髮布和規範-替代版本對方面的總體優先級排序方法可以在下面找到。

  1. 優先考慮網站的規範版本。
  2. 優先考慮中心實體和中心子主題。
  3. 在備用語言版本中優先考慮流行語言。

開始您的 14 天免費試用

親自了解為什麼 Oncrawl 是市場上最受認可的技術和數據 SEO 平台! 無需信用卡,也沒有附加條件:只需 14 天的全功能試用。
開始試用

關於國際和多語言搜索引擎優化的最後想法

在編寫這些多語言和國際 SEO 指南時,我試圖涵蓋一般 SEO 指南中未提及但搜索引擎知道、關心和利用的內容。 大多數時候,對於多語言搜索引擎優化,大多數搜索引擎優化只關注hreflangs,但實際上,影響多語言網站國際搜索引擎性能的不僅僅是hreflangs。

best performing countries for ForexSuggest.com
ForexSuggest.com 表現最佳的國家/地區。 從非洲到其他大陸,平均排名和成功率差異很大。 網頁的本地相關性也是為了降低搜索引擎創建高質量 SERP 實例的計算成本。

多語言 SEO 連接到技術 SEO、本地 SEO、語義 SEO 和超文本(基於鏈接)連接。 對於搜索引擎來說,多語言網站在幫助他們縮小跨語言知識圖譜的差距、提取更多同義詞以及通過跨語言爬取、索引和排名來提高跨語言 SERP 質量方面提供了巨大的價值。

可以通過語義 SEO 獲得成為主題的主題權威。 通過多語言搜索引擎優化可以通過增加跨語言的歷史數據來鎖定主題權威。

Internal Link Rot
Internal Link Rot 也會影響 Googlebot 的抓取效率。 GSC Crawling Data 不完整,但即使是部分部分也顯示了不必要的 CSS 和 JS 文件以及非 200 URL 的效果。 對於多語種網站來說,這些問題會影響國際SEO性能和搜索引擎對多語種網站質量和信任度的判斷。

在這些多語言 SEO 指南中,我試圖通過處理搜索引擎通過其文檔的觀點來關注多語言和區域網站的規範和替代版本、品牌標識、設計一致性、hreflang 的 PageRank 以及質量共享效應之間的關係. 為此,我使用了一個在技術 SEO 方面存在大量錯誤的網站,以及通過修復一些關鍵錯誤來實現增長的動力。

這個 SEO 案例研究的重要性不在於流量,也不在於 400% 以上的自然點擊增加。 它來自於能夠理解多語言網站搜索引擎的觀點。

稍後再見,了解更多新的 SEO 案例研究和實驗。