多语言和国际 SEO:指南和案例研究

已发表: 2021-09-06

多语言 SEO 正在针对多种语言和多个地区优化网站的 SEO 流程。 多语言 SEO 专注于网站的不同部分,或品牌实体针对不同地区和语言的多个域。 它包括技术 SEO、语义 SEO、本地 SEO、内容相关指标和上下文搜索原则。 由于多语言网站更大、成本更高,但对搜索引擎用户来说信息量也更多,搜索引擎对多语言网站的看法侧重于不同语言的文档检索的分类质量、主题权威和成本。

GSC performance graphic
ForexSuggest.com 是多语言 SEO 指南和案例研究的主要示例。 它有大量的技术 SEO 问题,但通过关键更改,它仍然能够从 2021 年夏季赢得 Google 的两个广泛的核心算法更新。在接下来的部分中,您将看到从 9 月开始更新的 GSC 性能图形。

谈到多语言搜索引擎优化,大多数搜索引擎优化只关注hreflangs,或者,如果他们更小心一点,他们也关注URL模式。 但是,实际上,对于国际和多语言搜索引擎优化,搜索引擎可以关注的事情还有很多。 搜索引擎可以使用跨国网站来提高其语言理解、命名实体识别和相关算法、同义词提取和查询扩展过程以及 SERP 质量。 此外,多语言网站可以利用搜索引擎的这种兴趣来增强自己在 SERP 上的权威和存在。

article by Danny Sullivan from 2011
Danny Sullivan 于 2011 年发表的一篇文章展示了跨语言信息检索的重要性,同年 Google 发布的一篇文章展示了多语言网站的重要性。

在这个 SEO 案例研究中,一个甚至大部分时间都不使用“www”版本响应的网站将被证明从 2021 年夏季开始赢得两个不同的广泛核心算法更新。

“通过为 ForexSuggest.com 上最受欢迎和最重要的部分实施 hreflangs,并使不同语言部分在设计和内容数量方面更加一致,我们通过多语言 SEO 提高了我们的有机可见度。”

路易斯·舒曼

SEO案例研究的背景和介绍

这些多语言 SEO 指南和案例研究将说明搜索引擎的观点、多语言网站的广泛吸引力优势、hreflang 标签的重要性及其有效性,以及不同网页部分之间的对称性,使用 ForexSuggest.com 和41 种不同语言作为SEO案例研究。

ForexSuggest.com SEO 案例研究的结果如下。

  • 六个月内自然流量增加 435%
  • 展示次数增加 164%
  • 157% 活跃页面增加
  • 新查询数增加 58%
  • 点击率增加 72%

在这个 SEO 案例研究中,ForexSuggest.com 发布了比竞争对手更多的新内容。 凭借跨语言和跨区域的内容、上下文内部链接和设计一致性,尽管存在大量技术 SEO 错误和不对称内容以及多语言网站问题,但它还是通过赢得 Google 的 2 次广泛核心算法更新而蓬勃发展,在 2021 年夏天。

Last 220 Days Comparison of ForexSuggest.com
ForexSuggest.com 的过去 220 天比较。

ForexSuggest.com 项目的技术 SEO 错误和一般外观是什么?

ForexSuggest.com 有各种可能的技术 SEO 错误,包括没有响应每个来源名称的变体,例如“www”。 下面,您将看到网站上技术 SEO 错误的一般背景。

  1. 数以千计的规范化和重复内容错误
  2. 数百页内容薄而不足
  3. 这些瘦内容页面中的一些被认为是软 404
  4. 数以万计的内部重定向
  5. 数以万计的“抓取未编入索引”的 URL 是质量问题的信号。
  6. 数百页 404 页
  7. 数千个内部 404 链接
  8. 数百个已发现但未编入索引的页面,这在搜索引擎眼中是质量和技术问题的信号
  9. 结构化数据解析和属性错误,收益
  10. 站点地图中的 404 个 URL
  11. 一半的网站不在站点地图中
  12. 站点地图中没有索引的 URL
  13. 缺少规范
  14. 缺少 Web 安全响应标头
  15. 数百个500级错误
  16. 数百个索引但被阻止的错误
  17. 99% 的网站未能通过 Core Web Vitals
  18. 没有响应版本“www”
  19. 数千页的混合内容错误
  20. 该网站没有用于尾部斜杠或大写小写字母的 URL 合并
  21. 80% 的分页有缺陷。
  22. 有数百个内部nofollow
  23. 缺少 HTML 大小、未使用的代码量或任何类型的 PageSpeed 和爬网效率优化
  24. 多个 H1 one 标签,或没有适当的可访问性标题层次结构

Excluded Section of ForexSuggest.com from GSC
Google Search Console 中 ForexSuggest.com 的排除部分的一般视图。 实际的错误计数比图像中的要高得多。

除了技术方面的 SEO 问题外,多语言 SEO 方面也存在与内容相关的问题,例如不对称的网站结构、大量未翻译的内容、移动的锚文本或网页设计和布局。 老实说,直到现在,我什至没有告诉多语言 SEO 案例研究网站的 40% 的一般 SEO 问题。 我想谈谈与 AMP 相关的问题,例如无效的 AMP HTML 结构和空白打开的 AMP URL,例如:“https://forexsuggest.com/fr/examen-infinox/amp/”。

organic search performance change graphic for ForexSuggest.com
ForexSuggest.com 过去 6 个月的自然搜索性能变化图。 在这几个月里,发生了 5 次未确认的 Google 更新、两次广泛的核心算法更新、一次垃圾邮件更新、一次 PageSpeed 和页面体验更新。

但是,我告诉我的 Oncrawl 朋友让这篇文章保持简短,正如你已经注意到的那样,我一如既往地失败了。 但是,如果您想了解有关多语言 SEO 概念的更多信息,并且如果您对搜索引擎、它们的结构、决策树和生态系统有深入的了解,请阅读多语言 SEO 指南和案例研究的长版以了解更多概念,观点和深刻的理解。

AMP Test Example
来自 Google 的 ForexSuggest.com 的 AMP 验证工具的 AMP 测试示例及其结果。

除非你对搜索引擎有相当的了解,否则你应该阅读我用 Oncrawl 为你准备的这个简短版本,而不是长版本。

empty AMP URL 网站的空 AMP URL 沉淀示例。

最后,我需要提到该网站有很多垃圾邮件有害的外部链接,并且还没有适当的拒绝文件吗? 因此,从 SEO 的各个角度来看,该网站都有很多问题,但它仍然能够通过每两个月将流量翻一番来赢得每次 Google 更新。


当我看到所有这些技术和非技术问题时,我感觉就像 Izzi Smith 为 SEO 创作的精彩 GIF。

此多语言 SEO 案例研究的决策和优先级排序过程

ForexSuggest SEO 案例研究也是一个很好的例子,让 SEO 决定在正确的问题上花费资源,以提高搜索引擎的整体网站质量、清晰度和可理解性,从而赢得广泛的核心算法更新。 在内容部分,大部分内容是我开始做项目时发布的,并且一直在继续发布。

crawl output from Bing Webmaster Tools
这是 ForexSuggest.com 的 Bing 网站管理员工具的示例爬网输出。 而且,特别是 HTML Size 太长,错误会导致部分索引、部分缓存,同时使搜索引擎的 HTML Digestion 变得更加困难。

为了保持国际 SEO 指南的整洁,我将给出我使用的决策树以及可能的改进,以便从一开始就以最佳效率使用所有劳动力。

  1. 我没有专注于技术 SEO 问题,因为解决这些问题需要 20 人的团队几个月。
  2. 我没有关注内容的问题,因为项目所有者已经在过去的内容上投入了大量资金,我所能做的就是给作家们提供培训和建议,通过降低发布频率来保持内容发布频率高于竞争对手。不同语言部分之间的不对称性。
  3. 该网站展示其潜力基本上有两个优势,多语言使其在搜索引擎中比其竞争对手更重要。 第二个优势是广泛的吸引力。
  4. 为了利用这两个优势,我必须关注多语言 SEO 的四个主要概念。
  1. 不同语言部分之间的对称性,在内部链接、锚文本、内容量方面。
  2. 不同语言部分之间在设计、网页布局、组件、品牌标识、品牌颜色方面的一致性。
  3. 在内容配置文件、标题-文本对和 URL 计数方面匹配不同的语言部分。
  4. 优先考虑规范版本、热门话题和流行语言。

优先级、对称性、可匹配性和一致性是本多语言 SEO 案例研究和国际 SEO 指南的主要原则。
在接下来的部分中,20 点将根据这些原则从搜索引擎的角度为多语言网站解释国际 SEO 的注意事项和理解。

Statista Language Usage statistics for web users
网络用户的 Statista 语言使用统计。

1.了解多语言网站规范版本的价值

该网站的规范版本是具有规范语言的网站。 多语言网站的主要目标受众是来自规范版本的位置和语言的受众。 这是多语言网站上常见的错误之一。

请记住,完整的目标受众是网站多样化语言和区域部分的目标受众。 但是,必须通过网站的内容来满足主要目标受众的需求。 这可以通过点击满意度来衡量,以便搜索引擎可以在跨语言信息检索和跨语言索引和排名中信任相同的来源。

CTR and Average Position
对于规范版本,点击率和平均排名远高于替代版本。 在我们的例子中,它是南非。

对于多语言网站,可以在下面找到规范版本应遵循的内容。

  1. 内容发布频率和大小:网站的规范版本应优先考虑内容发布频率和将提供的信息量。
  2. 链接流向:规范版本应该比替代版本有更多指向它的内部链接。
  3. 对称:多语言网站的规范版本和多语言网站的替代版本应该具有彼此对称的结构。
  4. 审核:规范版本应优先考虑内容、用户体验、网页布局或页面加载性能优化方面的相关性和质量审核。

language distribution for content on the web
网络内容的语言分布。

多语种网站和规范版本的话题权威效应

与替代版本的类似问题相比,规范版本上的质量、不相关或主题覆盖差距和不全面的内容可能对多语言网站的主题权威造成更大的损害。 借助语义 SEO,借助历史数据,通过正确的内容结构覆盖每个相关实体、属性、可能的搜索活动和相关搜索意图,成为行业的主题权威或主题是可能的。 基于此,多语言网站可以通过语义 SEO 与语言无关的特性来增加其主题权威。


Lindsey Wiebe(纽约时报的 SEO 经理)向 Google 的 John Mueller 提出的 Google 搜索问题,展示了搜索引擎对不同语言的看法,以及新闻 SEO 的地理位置和热门轮播选择。

使用跨语言的综合内容网络覆盖主题将为具有预定义质量分配的源生成更好、更多的历史数据和主题权威……要了解什么是主题权威以及如何将其用于 SEO,您可以阅读相关的 SEO指导和案例研究。

Website quality signal generation
谷歌“网站质量信号生成”专利中的一段。

2.使用一致的内部链接结构和链接流程

链接流是网页之间链接的方向和强度。 多语言网站的规范版本和替代版本之间一致的内部链接结构包括相同的站点树和对称的站点结构。 如果多语言网站具有与另一个替代版本不同的内部链接结构和内部链接流行度,这可能会在不同语言和区域部分之间创建不对称的网站结构。

ForexSuggest Multilingual SEO Project
这是 ForexSuggest 多语言 SEO 项目 9 月 4 日的屏幕截图。

在搜索引擎的站点树和爬网路径方面具有不一致的替代版本可能会使爬网过程更加困难,因此基于概念、短语和意图将不同的网页或部分相互关联起来成本会更高。

Same Internal Link Structure
每个语言部分的主页具有相同的内部链接结构和设计。

使用相同的内部链接结构和替代之间相同的链接流程设计将为搜索引擎创建一致、清晰的相关性、上下文和爬取路径,并为用户创建良好的导航路径。

当涉及到主页时,替代版本和规范版本之间的一致链接结构更为重要。

  1. 对跨语言部分使用相同的内部链接结构。
  2. 使用相同的链接流和方向,不同部分的流行度。
  3. 链接规范版本多于替代版本。

ForexSuggest.com’s Performance Report from Bing Search Engine
这是来自 Bing 搜索引擎的 ForexSuggest.com 过去 6 个月的绩效报告。 我还将在未来的 SEO 案例研究中包含 Bing 的性能报告。 而且,在夏季,我们还可以看出 Bing 会执行自己的更新,自然搜索性能的提升也适用于 Bing Search。

4. 跨语言使用一致相似的锚文本

搜索引擎处理链接文本以了解链接的目的以及链接源网页和链接目标网页之间的关系。 与使用一致的内部链接结构一样,跨语言使用对称锚文本也很重要。 如果从页面“A”到页面“B”,您使用 C 作为链接文本,对于另一种语言,您应该使用“C”最接近的翻译作为链接文本。

想象一下,你是一个搜索引擎,你尝试爬取和理解一个多语言网站,你会发现它比单语言网站成本更高,因为它要大得多,而且跨语言、历史数据等的相关查询也更多排名和质量信号。 在这种情况下,如果您将“儿童床”网页中的“儿童床”网页与“儿童床价格”的链接文本链接,并且对于另一种替代语言和版本,如果您使用“儿童睡眠”的锚文本对于相同的页面,这种不一致会削弱网页及其替代页面的相关性和上下文。

internal link popularity
在内链流行度上,多语种网站的不对称性有所好转,但仍是最流行的,国际网站的规范版本并没有得到适当的优先级。

使用相同的链接结构,链接流向,与链接文本的流行度分布将使对称替代版本与规范版本的爬行,理解和匹配。

最后,要查看多语言网站的主要语言,搜索引擎可以比较跨语言锚文本及其数量。 因此,优先考虑规范版本对于以跨语言方式使用锚文本也很重要。 并且,确保翻译后的规范标签将保护其与链接源网页的标题、标题和目标网页的标题以及标题的相关性,即使您翻译它们也是如此。 因此,这不仅仅是一个翻译过程。 就锚文本的含义而言,翻译后的内容还应按原样包含锚文本。

  1. 使用与其含义一致的锚文本。
  2. 翻译所有的锚文本。
  3. 跨语言创建相同的相关性和导航方向。
  4. 按原样翻译标题和标题,并确保锚文本作为跨语言存在于目标内容中。
  5. 优先使用锚文本的规范版本。

external references
外部参考文献中的大多数锚文本都是英文的。 对于一个成功的多语言网站,针对每个基于用户的信号使用受众多样化也很重要。

5. 无一例外地翻译所有内容

了解网站和网页内容的语言可能会给搜索引擎带来问题。 例如,如果一个网站有 500 个网页,其中 250 个是英文,50 个是德文,200 个是法文,这会使搜索引擎混淆以下问题。

  1. 这个网站的规范版本是什么?
  2. 这个多语言网站的主要目标受众是什么?
  3. 这些内容是等价的吗?
  4. 它是否以相同的不同语言发布相同主题的内容?
  5. 他们是否同时为法国、美国、新西兰、加拿大、英国、土耳其提供服务?
  6. 哪个内容可以匹配哪个?
  7. 是否有 hreflang 信号,是否正确使用?
  8. 是否有 URL 细分?
  9. 就内部链接而言,哪个部分更受欢迎?
  10. 他们从哪里获得更多链接? 来自英国还是美国?
  11. 他们的锚文本的主要语言是什么?
  12. 本地化版本是否有地址、电话号码或创始人信息?
  13. 他们在社交媒体和合作部分使用哪种语言?
  14. 规范版本的 IP 地址、DNS 区域是什么?

除了这些问题之外,搜索引擎还有更多问题,但对于这个多语言 SEO 指南的简短版本,这些就足够了。 为了了解多语言网站的主要身份和服务区域,搜索引擎会检查主页的语言和锚文本的语言。 但是,如果替代版本翻译得不够充分,就会造成跨语言质量下降。

Augmenting queries with synonyms selected using language statistics
来自 Google 的“使用语言统计选择同义词增强查询”专利的架构。

在某些情况下,Web 上的某些来源在样板内容中使用未翻译的内容,例如侧边栏、页眉和页脚。 多语言网站应同时翻译样板和主要内容。 该特定部分的主要语言,无论是子域或子文件夹,还是单独的域,都应完全用于网页的每一英寸。

搜索引擎将更关心可见内容、可见链接、文本和视觉元素来确定网页的语言,因此使用清晰的设计和视觉信号很重要。

  1. 翻译样板内容。
  2. 翻译主要内容。
  3. 翻译口号、座右铭、小节。
  4. 除非有正当的文化原因,否则无一例外地翻译所有不同的网站部分。

[案例研究] 通过页面 SEO 推动新市场的增长

当 Springly 开始考虑向北美市场扩张时,页面 SEO 已被确定为在新市场成功起步的关键之一。 了解如何通过技术 SEO 为您的内容策略从 0 到成功。
阅读案例研究

6. 与本地作者和团队一起审核翻译质量

SEO 无法了解所有语言,但在多语言 SEO 项目中,您需要管理您实际上并不了解的语言的 SEO 性能。 技术 SEO 与语言无关。 换句话说,它适用于具有相同方法的每种语言。 但是,多语言搜索引擎优化是基于语言差异。 因此,审核网站内容的质量对于外语来说可能并不容易理解。

Google’s Automatically Generated Content
Google 自动生成的内容中的一个部分。

在这种情况下,替代版本的语言应该由当地团队审核,或者作者和审核员应该是互不认识的不同人。 如果一个语言和替代版本的翻译质量不够,非质量内容也会影响替代版本的主题权威、分类质量和相关性。

  1. 与母语人士一起审核不同的语言内容。
  2. 就您的 SEO 观点和策略对母语人士进行教育。
  3. 审计员和作者不应该互相认识。
  4. 如有必要,与其他审核员一起审核审核员。

Page Experience report of the ForexSuggest.com
ForexSuggest.com 页面体验报告的一般视图。

7. 本地化规范部分的替代版本

多语言非对称网站在某些语言中的 SEO 性能可能较差,从而难以抓取和匹配相关部分。 但是,由于地区和文化差异,多语言网站的某些部分可能是不对称的。

内容本地化对于保持多语言网站的每个部分的相关性和可能的​​相关搜索活动的质量非常重要。 内容本地化是根据当地文化和语言为受众优化网页内容。 因此,某些网页可能未翻译成某种语言,或者在某些情况下网页可能包含额外的部分。

Cross-language Search Patent
Google 的“跨语言搜索专利”部分。 对于本地连接,有两种不同类型的实体,本地实体和远程实体。 对于单语网站,实体可以是远程的,但对于有组织的多语言网站,来自同一主题的实体可以是本地的,并且更相关。

但是,网站不可能通过此类本地化示例达到不对称点。 通过创建基于模板的内容,可以为国家名称、城市名称、地区名称或其他命名实体及其属性提供变位。 因此,在更新特定区域的内容时,也可以将其标记为替代。 与本地化替代版本相关的一些注释如下。

  1. 使用内容本地化来提高替代版本的质量和相关性。
  2. 如果它对某个地区或文化没有意义,请不要翻译它。
  3. 尽量使本地化内容与基于模板的内容保持对称。

Cross-language search
跨语言查询评估模块,谷歌“跨语言搜索”专利的一部分。

8.永远不要跳过hreflang的使用

Hreflang 是一个相关的多语言 SEO 标签,介于网页的替代版本和规范版本之间。 Hreflang 可以帮助搜索引擎进行更好的网页探索、替代版本匹配,并在它们之间共享 PageRank、质量和相关性信号。

因此,hreflang 不仅仅是匹配备选方案,它还通过帮助搜索引擎以更简单的方式抓取网站来共享质量、相关性和权威信号。 因此,内容对称和完整的翻译很重要。 如果网页没有规范版本的一半内容,则搜索引擎可以忽略 hreflang,因为它包含缺失和不一致的信号。

Identifying relevant document languages through link context
谷歌“通过链接上下文识别相关文档语言”专利。 多语言搜索引擎优化的语言转换按钮的重要性也可以从这个模式中看出。

Hreflangs 是多语言 SEO 的一部分,但不是多语言和国际 SEO 的全部。 但作为多语言 SEO 策略的一部分,应使用具有 ISO 639-1 代码的语言和具有 ISO 3166-1 代码的区域的 hreflang 标签。

  1. 从一开始就使用hreflangs。
  2. 不要将相对 URL 与 hreflangs 一起使用。
  3. 为所有替代版本添加 hreflang。
  4. 在 hreflang 标记中使用正确的语言和区域格式。
  5. 如果您从一开始就没有使用过hreflangs,请检查添加hreflangs 后的平均位置变化,以及备用查询计数的变化。

将 hreflangs 添加到 ForexSuggest.com 多语言 SEO 项目后,自然点击量增加了约 100%。 这种增长因地区而异:对于某些地区来说,它是更好的,而对于某些地区来说,它是较小的。

internal linking
不同部分之间的内部链接和语言更改按钮应始终可见。

9.使用CDN服务器或多个本地服务器

搜索引擎可以检查网站的 DNS 区域和 IP 地址,以查看网站的位置并将其与目标受众相关联。 为多语言和多区域网站使用单个服务器位置可能会导致难以标记网站的替代部分并将替代部分与目标受众匹配。 使用本地服务器不仅有助于将网站的各个部分与不同的地区和语言进行匹配,而且还可以使在相关地区使用相关语言的用户更快地访问网站。

Total Content Length
替代版本的总内容长度,以及规范版本及其在多语言网站总内容长度中的百分比。

为每个区域和语言使用单独的服务器可以减少多语言网站的首字节时间。 这将有利于直接来自不同地区的搜索引擎爬虫爬取您的网站,而页面体验的改善将直接或间接地为 SEO 做出贡献。

  1. 为每种语言和地区使用本地 IP 地址和 DNS qone
  2. 为多语言和区域受众使用多台服务器

在 ForexSuggest.com 项目期间,对于每种语言和区域,都使用本地区域的不同服务器、数据库和 WordPress 设置,并具有本地化 IP 。 我对此的推理也是基于经验:在过去,我遇到过波兰网站由于乌克兰 IP 地址而主要从乌克兰吸引流量的情况。 即使搜索引擎可以在以后解决这些问题,从一开始就给出一致和明确的信号将使网站的排名随着时间的推移而提高。

content amount and content length
不同部分的内容量和内容长度的饼图。

10. 在不同部分使用一致的设计、品牌颜色、标识和网页布局

网站每个 URL 的一致品牌标识以及可用性模式、颜色、网页布局有助于提供一致的视觉传达。 这减少了用户的学习时间并提高了搜索引擎的置信度,防止他们感知无机网站结构。无机网站结构是一种复杂的结构,不会跨不同的子域、不同的域或子文件夹集成。 设计更改或徽标更改以及网页布局更改可以更改网页的含义、上下文和可用性。

由于多台服务器或多个前端、后端和作者、设计团队,多语言和多区域网站可以具有无机站点结构。 如果网站的品牌标志、基线、地址、电话号码、网页布局、颜色和排版发生变化,就会使眼球追踪和品牌塑造变得更加困难,同时让搜索引擎认为该网站不属于单一品牌实体。

extracted anchor texts
由于 HTML 损坏,提取的锚文本不是最佳形状,而是语言转换按钮,并且可以按语义顺序看到其内部链接。 尽管如此,“阅读评论”和其他类型的“非上下文”锚文本。

要了解无机站点结构的问题,您可以使用 Bing 的指南来解释它是什么以及为什么应该避免它。 在 2017 年之前,许多网站所有者将其子域或子文件夹出租给其他品牌。 由于权威的顶级域名更容易排名,人们租用这些网站的部分用于他们自己的主题或品牌。 此外,在黑帽行业中,即使子域属于主域,也会使用不同设计的子域来引导 PageRank 的外部流量。 换句话说,如果设计、主题和身份不同,搜索引擎就会认为它实际上是一个不同的网站。 然而,这种做法今天在一定程度上仍在继续。

Relative Frequency
使用 Google 的语言统计专利选择的同义词增强查询。 Google 可以使用“相对频率”来选择来源的点击满意度可能性,以及与其他国家/地区的本地相关性……

因此,使用一致的设计、网页布局、徽标、品牌名称、品牌基线、本地化地址、排版和 Web 组件放置对于使多语言网站保持一致非常重要。 这种一致性也使用户在可用性方面的语言转换更加顺畅。

  • 对每个子部分使用相同的设计、颜色和视觉元素。
  • 对每个子部分使用相同的徽标、品牌名称、品牌格言、品牌颜色。
  • 对每个子部分使用相同的网页布局、网页组件和位置。

在 ForexSuggest.com SEO 案例研究期间,大多数网站在主页等重要部分具有相同的设计,但在某些部分中存在不同的设计和应修复的可用性模式。

Danny Sullivan’s article
在 Danny Sullivan 的跨语言信息检索文章和 Google 的“语言障碍消除”公告 10 年后,Google 开始翻译文档以缩小语言之间的信息差距,以满足来自其他国家和语言的查询。 这也是一个信号,说明了为什么 SEO 应该考虑让他们的网站多语言化。

11. 使用多个站点地图和单独的 Google Search Console 帐户使分析更容易

使用多个站点地图有助于分析 Google Search Console 的不同部分的覆盖率报告。 如果一个多语言网站有 41 种或更多不同的语言,则在有机流量、用户行为、转换或索引以及技术 SEO 方面分析每个网页部分的不同语言需要高水平的数据过滤。 Filtering and grouping all of the URLs from the beginning via different and segmented sitemaps are useful to make data analysis easier for SEO.

errored sitemaps
The errored sitemaps can be seen for the ForexSuggest.com from both of the Google Search Console and Bing Webmaster Tools.

Data analysis and data science is an important part for SEO. Part of this process is data preparation, and examining the right part of the data at each step. Another part of this process is visualization. I will show some examples of visualization later, but if you want to learn more about Data Science, and Visualization for SEO, you can read related guidelines.

Google Question Hub
Google Question Hub is about satisfying the questions that are not answered on the web. A question might be answered for a language, but might not be answered for another one. In this context, Question Hub, and Cross-lingual Information retrieval, crawling, indexing, and query expansion are connected to each other.

When preparing data, segmenting the available data according to the axes you will want to analyze is an important step. Thus, segmenting sitemaps is important as creating different Google Search Consoles for different subsections. Different GSC account setups for every different language section of a multilingual and international website are useful to make organic search performance, Page Experience Report, and Links report analysis easier.

45 different sitemaps
There are 45 different sitemaps for this multilingual SEO Case Study, and the asymmetry and topical coverage differences can be seen clearly.

Having multiple but smaller sitemaps can help a search engine to download the sitemap more frequently for crawling and refreshing purposes. In news SEO, smaller sitemaps for similar site segments usually help to increase the count of indexed web pages. A multilingual website can also use smaller and multiple sitemap counts for the same purposes.

  1. Use different Google Search Console accounts for every language and region section.
  2. Use different sitemaps for every language and region section.
  3. Make the sitemap files smaller if it is possible, and use different sitemaps, and GSC accounts for data analysis.

coverage report
For every sub-section or language-based subfolder of the multilingual website, examining the coverage report will be more efficient.

12. Understand the value of multilingual and regional websites for search engines

Multiregional and multilingual websites are valuable for search engines to perform query expansion for cross-lingual information retrieval and indexing.

gender related bias
A research paper publication from Google related to the gender related bias within the open web that affects the NLP and NLU. Google talks translating content on Wikipedia without any gender bias by explaining the language based structural differences, and it includes cultural differences too.

The goal of cross-lingual information retrieval is to understand multiple languages for a topic by recognizing entities, understanding sentence structures, and matching the synonyms. The second value of multilingual websites for a search engine is that they satisfy users for multiple languages for the same topic. Instead of crawling, rendering, understanding, evaluating, indexing, and ranking 10 different sources from the web, a search engine can choose one source with “broad appeal” for a topic with multiple languages. Quality multilingual websites help a search engine to understand a topic in a better way by examining the queries from different languages, and satisfy more users from different cultures and segments.

improved organic search performance for all regions
This is another example for entirely another industry. The main difference is that the most important sections are translated into the other languages. And, e-commerce and informational web pages improved organic search performance for all regions together.

The third value of multilingual websites for a search engine is that they help search engines to find quality documents for other languages by clustering. A search engine can find a quality document and then clusters similar other documents for the specific document. If a source is authoritative across languages for a topic, these documents can be used to predict the quality of new documents or new sources from these sources.

A short list of benefits and values of multilingual websites for search engines is listed below.

  1. Helps for query expansion
  2. Helps for cross-lingual information retrieval
  3. Helps for cross-lingual indexing and ranking
  4. Helps for cross-lingual synonym extraction
  5. Helps for cross-lingual quality evaluation for similar documents
  6. Helps for cross-lingual entity extraction, and natural language understanding

the change after the translation is reciprocal
The change for the different countries for the second example after the translation is reciprocal as expected. Every improved organic search performance for a country benefited the other organic search performance profiles for other countries as well.

13. Understand the cross-lingual indexing and ranking for search engines

Cross-lingual indexing and ranking is the process of comparative indexing and ranking across different languages based on different queries, entities, and possible search intents. With the help of semantic SEO, Google has started to understand entities in a language-agnostic way and to connect the questions and possible search activities to each other across languages.

The main obstacle of uniting all of the user data from around the world is that of creating a consistent list of synonyms and co-occurrence phrases for every contextual domain. Entities do not need language to be expressed or to exist, but users of web search engines need phrases to express their needs behind the query. Thus, cross-lingual indexing and ranking help a search engine to increase the SERP quality and documents' relevance for certain entities based on cross-lingual concepts.

cross-lingual indexing and ranking

A search engine can collect all of the n-grams, co-occurrent phrases, and entities from a multilingual website in a comparative way. Every entity will be processed with different phrases but also different angles from every geography. Winston Churchill is the victor of the Second World War for a British newspaper, but a newspaper from India can have a different attribute for the same entity. Thus, cross-lingual indexing and ranking will help a search engine to increase its confidence score for certain connections between phrases and entities by improving its knowledge graph full of facts between entities.

A research paper from 2018 in Google
A research paper from 2018 in Google. Daniel Vrandecic seeks methods to make information more available for different languages by translating Wikipedia articles to other languages by protecting objectivity. It is also a good research paper to see trust signals, and subjectivity perception of a search engine.

Cross-lingual indexing and ranking are possible with cross-lingual crawling and information retrieval. Google is a semantic search engine and semantically created sources with semantic information will thrive in SERP. Google is also a multilingual search engine. A multilingual website will have the benefit of aligning its own features and structure with the search engine.

topical authority
Creating a topical authority for a source for a language is useful, but doing the same thing across different languages is more useful, and it will make the source more valuable.

  1. 查询扩展是将查询翻译成另一种语言以检索高质量文档的过程,目的是从原始查询语言的相似来源中找到最相似的文档。
  2. 跨语言索引可以帮助搜索引擎统一跨语言的用户数据和反馈,以生成更令人满意的质量检测算法。
  3. 多语言搜索引擎有自己的翻译器,如果文档语言与设备、操作系统(操作系统)或浏览器的语言不同,它们允许用户使用文档的翻译版本。
  4. Google 将原始查询语言称为“源语言”,并将原始查询称为“源查询”。
  5. 有些查询对于所有语言都是相互的,因此语言检测可能很困难。 对于这些查询,谷歌提供了一个跨语言的 SERP 实例。 谷歌称之为“跨语言搜索”。
  6. Google 使用“Cross-Language Information Retrieval”的“CLIR”缩写。
  7. 在文件中,搜索引擎意识到有争议实体的语言之间存在偏差,因此具有权威、证据和 EAT 的来源将被 CLIR 系统优先考虑。

Google’s Cross-language search patent
来自 Google 的跨语言搜索专利的架构。

14. 使用具有外部参考、提及和联系的受众多样化

跨语言搜索的受众多样化和流行度在搜索引擎眼中是相互关联的。 谷歌提到了“消除口头查询词的歧义”、“为帖子的作者评分”、“增强兴趣点识别”、“显示与设备上播放的内容相关的信息”的“流行度信号”。 谷歌可以将人气作为衡量可靠性和质量的指南针。 受众多样化是通过链接、提及或视觉元素、访问者使外部参考的 IP 地址多样化的过程。 IP地址可以显示用户的位置,即使用户试图隐藏他/她的IP地址,谷歌也知道用户的ISP(互联网服务提供商)。 此外,Google DNS 服务器对于 Google 跟踪用户的搜索字词、访问过的网站、甚至在网络上听过的歌曲或下载的电影很有用。

guess the geo-location of a user
根据谷歌专利中的用户配置文件模式优化位置估计和反向地理编码,以猜测用户的地理位置。

对于多语言 SEO,考虑到跨语言的流行度、可靠性和质量信号,通过使所有信息点多样化以与不同的地理区域、语言和用户细分相关,这一点很重要。

  1. 外部引用的多样化IP地址
  2. 通过使跨语言的实际流量多样化来多样化流行信号
  3. 增加品牌跨语言导航查询的搜索需求
  4. 使用跨语言的社交媒体来提高流行度信号

Dynamic Language Model” patent of Google
Google 可以根据流行度信号触发不同类型的算法,无论是针对查询还是跨语言来源,“Google 的“动态语言模型”专利”。

要了解有关受众多样化的更多信息,您可以阅读其对新闻 SEO 的重要性。

[案例研究] 优化链接以改善具有最大投资回报率的页面

在两年的时间里,RegionsJob 通过微调其网站的内部链接结构以创建高效的架构,解决了提高投资回报率的挑战。 该策略集中在支持网站目标的 SEO 操作上。 基于页面盈利能力的 KPI,RegionsJob 实施了一些修改,以创建一个具有更好用户转化率的网站。
阅读案例研究

15.不要使用本地自适应网页

本地自适应页面是根据用户的 IP 地址从另一个 URL 重定向到用户,或者它可以根据浏览器、操作系统或设备的语言显示不同的语言内容。 本地自适应页面可以防止来源使用自己的主页来欢迎搜索引擎爬虫。 就理解最重要的内部链接、锚文本或来源的上下文和身份而言,来源最重要的网页是其主页。 因此,将搜索引擎爬虫重定向到非主页或具有本地自适应网页的主页替代页面不是搜索引擎友好的沟通和实践。

An announcement from Google for “locale-adaptive pages”
谷歌在 2018 年发布的“区域自适应页面”及其抓取过程的公告。

将搜索引擎爬虫和用户重定向到基于不同 IP 的不同 URL 将削弱搜索引擎的置信度分数,以了解网页与特定地理、语言以及搜索意图、概念和短语的相关性。

  1. 根据不同的 IP 重定向到不同的 URL 会稀释网页的上下文,并且会导致更难理解网页的原始内容。
  2. 当用户尝试登陆主页时不要重定向用户。 不要使用本地化主页替代品而不是真实主页。 在主页上反映主要受众的语言。
  3. 如果您阻止某个地理区域的用户,也可以阻止这些特定区域的搜索引擎爬虫。
  4. 与“单独的区域设置 URL”的 URL 和内容结构保持一致。

最后,Google 通过更改其“Accept-Language”HTTP 标头和 IP 地址来支持“地理分布式抓取”和“语言相关抓取”,以查看网页的实际内容。 谷歌支持本地自适应网页在他们找到的时候在网络上工作,但这并不意味着对于国际 SEO 来说,从搜索引擎的角度来看,自适应语言环境的页面成本更高且更难理解。

visualization of the ForexSuggest.com’s URL pattern
这是 ForexSuggest.com 的不同语言部分的 URL 模式的可视化,以及它们在站点树中的频率。 不对称结构可以在这里看到。

16. 始终使用一致的主页

在多语言和国际 SEO 中拥有跨不同网站语言的一致主页非常重要,因为它反映了来源的身份和最重要的网站部分。 搜索引擎爬虫在访问 robots.txt 文件后立即访问主页。 不同替代语言之间的不一致主页可能会削弱特定行业来源的身份、品牌形象和相关性。 网络上有些资源没有主页,而是使用子目录作为特定语言和地区的主页。 这种情况会损害来源的清晰度,并切断更好的 PageRank 分布的潜力,通过主页发出相关信号。

visualization example of the Hreflang Implementation
这是 ForexSuggest.com 的 Hreflang 实现的可视化示例。 可以很容易地看到优先部分、不对称、延迟部分和一般缺失部分。

即使 SEO 项目使用动态渲染,将用户和爬虫重定向到不一致的不同 URL 也会损害来源的可靠性,以及搜索引擎通信的效率。 即使有一个 URL 更改的 SEO A/B 测试,使用 302 重定向,只有两周是理想的持续时间。 两周后,Bing 假设 302 重定向实际上打算用作 301 重定向; Google 认为 302 重定向保留时间过长是为了欺骗搜索引擎,但它没有定义此特定算法触发的确切持续时间。

URL Count for the Canonical English Version
规范英语版本和替代版本的 URL 计数及其百分比。

多语言搜索引擎优化的一致主页的好处可以在下面找到。

  1. 提高PageRank分发效率
  2. 提高爬取效率
  3. 从主页反映来源的身份和优先受众
  4. 从主页给出最重要的术语、n-gram、锚文本
  5. 向用户和搜索引擎反映品牌的身份。
  6. 具有品牌知识面板的一致 URL。
  7. 为外部参考和自然流量提供更好的一致受众多样化。

17. 尽可能使用 UTF-8 编码

UTF-8 使用单字节(8 位)系统对所有现有字符进行编码,其中有 1,112,064 个字符。 官方互联网号码分配机构 (IANA) 使用 UTF-8 编码。 此外,它是所有 CSS、HTML、XML 文档、资源和 HTTP 标头的标准。 因此,Google 更喜欢 UTF-8 以使抓取、索引、理解和排名过程更容易且成本更低。 由于多语言、多区域和国际 SEO 项目,域可以包含非 ASCII 字符和非 UTF-8 文档、资源中的字母、文档、标题或 URL(服务器上文档的名称和路径) .

UTF-8
对于所有国际 SEO 案例研究主题网站,都使用 UTF-8。

对于结构化数据,如 UTF-8 编码或其他类型的搜索引擎优化相关标签,也可以看到搜索引擎的习惯。 对于 Schema 标记,Google 更喜欢 JSON-LD,因为从 JSON-LD 中理解和提取数据的成本低于微数据或 RDFa。 使用国际化域名可能有助于与主要目标受众建立联系,但对于所有目标受众来说,仍然可能难以理解。

要执行 ASCII 和非 ASCII 字符之间的转换,搜索引擎可能需要使用 ToASCII 和 ToUnicode 类型的算法。 而且,任何额外的算法工作或理解或索引网站的阶段,都会使国际 SEO 变得更加复杂。 以国际标准清晰易懂更有利于搜索引擎的感知,也有利于用户的理解。

Identifying common co-occurring elements in lists
Google 的“Identifying common co-occuring elements in lists”专利中的一部分,用于在知识图中进行实体消歧和实体信息扩展。

18.不要依赖语言和地区的HTML标签

与语言和区域相关的 HTML 和元标记可用于定义 HTML 文档的内容语言或其预期语言,以及要服务的地理位置。 Google 会忽略 HTML Lang 属性和其他与区域相关的 HTML 标记,因为这些是网络上使用最错误且一致性最差的信号。

response time for the Googlebot
多语言网站可以通过使用跨不同语言部分的语义站点结构来提高其爬取效率,无论是在 URL、面包屑、语言转换按钮还是在 hreflang 中。 ForexSuggest.com 对 Googlebot 的响应时间为 869 毫秒,是 Google 建议的 4 倍以上。

大多数 HTML Lang 标签来自网站的主题语言,而不是来自内容的语言,并且大多数网站所有者不知道如何使用或更改位置元标签。 由于搜索引擎试图通过将 SEO 的大部分“命令”转化为“提示”来控制网站运营商和 SEO 对其内部系统的感知,因此忽略了多语言和区域 HTML 以及元标记由搜索引擎。

下面列出了一些区域元标记。

  1. HTML 语言属性
  2. 地区、城市或国家名称的“Geo.region”元标记。
  3. 带有“;”的坐标的“Geo.position”元标记分隔器。
  4. 带有“,”分隔符的坐标的“ICBM”元标记。

19. 审核多地区多语种的初排和再排流程

初始排名和重新排名是搜索引擎排名算法和过程的两个阶段。 初始排名是第一次对索引文档进行排名的过程。 重新排名是修改 SERP 上现有文档的排名的过程。 重新排序和初始排序过程可以通过相互的、重复的和始终在线的工作算法以及不同的和部分激活的算法来执行。

international SEO Project
对于这个国际 SEO 项目,我们至少有来自 241 个不同国家的印象。 在这种情况下,据我所知,我们只有 195 个国家,但谷歌有不同的视角来定义地球上的国家总数,以提高搜索结果的质量。

对于国际 SEO 项目,来源在某种语言的某些查询中的排名可能高于其他语言,或者它在某些主题中的排名可能高于其他主题。 同样的情况可能发生在不同的网站版块、作者或其他类型的差异上,例如社交媒体共享、站点地图中包含的 URL 或来自主页的链接。 初始排名和重新排名过程可能会受到外部和内部链接的删除、内部链接或锚文本的变化、来源的主题权威、查询需求的增加或减少以及质量、可靠性、相关性信号的影响。

Re-ranking and Initial Ranking
在规范版本重要性的背景下的重新排名和初始排名方面,由于规范版本在南非,其他靠近非洲国家的平均排名也更好,因为如果国际搜索引擎优化位于 X 国家,它也可以与周边国家和这些国家的观众有更多的联系。

在这种情况下,初始排名和重新排名过程观察可用于国际和多语言 SEO,如下所示。

  1. 观察新发布内容的抓取延迟、索引延迟和初始排名。
  2. 使用所有相关性、突出性、可靠性和质量信号来使每个 URL 排名最初更高,例如所有索引信号、PageRank 共享机会以及具有上下文突出属性的相关实体。
  3. 比较不同语言、主题、作者、URL 模式或面包屑模式的初始排名。
  4. 使用 hreflang 使搜索引擎在语义上跨语言感知每个部分,以在不同版本之间共享质量和相关性信号,以获得更好的初始排名。
  5. 从主页的主要内容链接已发布的内容。
  6. 审核竞争对手的页面以查找最初排名较低的页面以查找模式。
  7. 等待重新排序过程的触发因素、频率及其方向。
  8. 审核搜索引擎如何根据“SERP 质量的信心”对页面进行重新排名。
  9. 为竞争对手的站点地图变化创建警报,并审核竞争对手的重新排名和初始排名过程,以了解他们对搜索引擎感知的权威和突出程度。

将来,我将发布一个新的 SEO 案例研究和新的指南,使用初始排名通过使用主题权威和语义 SEO,为网站的利益重新排名过程创造优势。

boilerplate content’s translation
就样板内容的翻译,以及设计、锚文本的一致性而言,可以看到上面的例子。

20.为你的利基优先考虑流行的语言和受众

对流行语言和受众进行优先排序是对内容发布进行优先排序,对最常用的语言进行更新频率的过程,并创造历史数据价值。 多语言网站的国际搜索引擎优化有不同的语言部分,每个部分都会为搜索引擎产生不同程度的价值。

链接价值主张是由搜索引擎为搜索引擎结果页面选择的来源提出的价值。 如果一个来源在已经给自己的链接(片段)的边界内为 SERP 质量提供了价值,那么搜索引擎将更有信心进一步对来源进行排名。 一个国际 SEO 项目不仅可以通过使用流行语言创建更多历史数据来确保其在最初以及在重新排名过程中获得更高排名的机会。

local relevance signals
如果您检查页脚设计比较,您应该意识到该网站使用卢森堡地址。 而且,由于南非规范信号,有许多非洲国家,我们还看到卢森堡的平均排名更好。 其中一些结果是由于竞争程度低,但其中一些是由于本地相关信号。

国际搜索引擎优化的内容发布和规范-替代版本对方面的总体优先级排序方法可以在下面找到。

  1. 优先考虑网站的规范版本。
  2. 优先考虑中心实体和中心子主题。
  3. 在备用语言版本中优先考虑流行语言。

开始您的 14 天免费试用

亲自了解为什么 Oncrawl 是市场上最受认可的技术和数据 SEO 平台! 无需信用卡,也没有附加条件:只需 14 天的全功能试用。
开始试用

关于国际和多语言搜索引擎优化的最后想法

在编写这些多语言和国际 SEO 指南时,我试图涵盖一般 SEO 指南中未提及但搜索引擎知道、关心和利用的内容。 大多数时候,对于多语言搜索引擎优化,大多数搜索引擎优化只关注hreflangs,但实际上,影响多语言网站国际搜索引擎性能的不仅仅是hreflangs。

best performing countries for ForexSuggest.com
ForexSuggest.com 表现最佳的国家/地区。 从非洲到其他大陆,平均排名和成功率差异很大。 网页的本地相关性也是为了降低搜索引擎创建高质量 SERP 实例的计算成本。

多语言 SEO 连接到技术 SEO、本地 SEO、语义 SEO 和超文本(基于链接)连接。 对于搜索引擎而言,多语言网站在帮助他们缩小跨语言知识图谱的差距、提取更多同义词以及通过跨语言爬取、索引和排名来提高跨语言 SERP 质量方面提供了巨大的价值。

可以通过语义 SEO 获得成为主题的主题权威。 通过多语言搜索引擎优化可以通过增加跨语言的历史数据来锁定主题权威。

Internal Link Rot
Internal Link Rot 也会影响 Googlebot 的抓取效率。 GSC Crawling Data 不完整,但即使是部分部分也显示了不必要的 CSS 和 JS 文件以及非 200 URL 的效果。 对于多语种网站来说,这些问题会影响国际SEO性能和搜索引擎对多语种网站质量和信任度的判断。

在这些多语言 SEO 指南中,我试图通过处理搜索引擎通过其文档的观点来关注多语言和区域网站的规范和替代版本、品牌标识、设计一致性、hreflang 的 PageRank 以及质量共享效应之间的关系. 为此,我使用了一个在技术 SEO 方面存在大量错误的网站,以及通过修复一些关键错误来实现增长的动力。

这个 SEO 案例研究的重要性不在于流量,也不在于 400% 以上的自然点击增加。 它来自于能够理解多语言网站搜索引擎的观点。

稍后再见,了解更多新的 SEO 案例研究和实验。