schema.org 語義標記,一場預定的革命
已發表: 2016-02-11幾十年來,互聯網面臨著巨大的變化,有些是搜索引擎強加的,有些是更微妙的,由於一些社區的創造力而自然出現。 因此,從 90 年代到現在,我們從保留給某些博士的互聯網轉變為一個所有人都可以隨時隨地訪問的巨型網絡。 我們的網絡擁有數十億份彼此不同的文檔。 谷歌將擁有超過 30000 億個索引頁面,每天將處理超過 33 億次查詢,其中大約 15% 是新查詢。
即使搜索引擎在其抓取處理和索引系統以及它們轉發信息的方式(從線性頁面結果到豐富的響應列表,同時提供更多關於與查詢相關的概念。 這些數據來源於引擎探索的一個新領域:語義數據。
從算法方面來看,這是下一個重要步驟,您有機會使其盈利。
想像一下爬行和排名算法的驚人工作。 如何理解文檔的含義、提取關鍵信息、過濾源代碼、從 HMTL 噪聲中分離信息、比較文檔以對它們進行排序、限定它們、分類它們然後根據用戶需求(或多或少識別)重新發送請務必以更優雅的格式提供最佳答案! 在越來越多的智能程序理解自然語言的時代,抓住頁面和查詢的深層意義對於未來的業務顯然很重要。
抓取和索引變得複雜。 我們需要更好的“智能”——競爭很激烈——而搜索領導者——有一天——圍繞同一個主題進行了討論:語義標記!
數據結構的預兆
法國網站 Abondance 的一篇文章已經討論了這個主題的起源。 有趣的是 Tim Berners-Lee 在 1999 年已經完整地描述了搜索引擎的語義突變。
這位有遠見的人夢想著一種自主機器,“智能”,經過訓練可以理解物理對象之間的關係,並且能夠通過語義抽象的形式有效地回答人類的詢問。
自創建以來,網絡通過將文檔鏈接到其他文檔的屬性和關係,圍繞文檔及其概念的描述進行組織。
RDFA 規範——用於屬性的資源描述框架——描述了一種新的連接類型,比錨更微妙:結構化數據。
尊重嚴格和類型化的規則,它們以語法組織,能夠通過屬性和具有已知類型的鏈接來豐富 HTML 元素中描述的任何概念。
一切都在那裡:概念、屬性、類型今天是 schema.org 項目的 Score、Prop 和 Type。
特殊性已經發展——它們已經被簡化和統一,但基礎是相同的。 頁面之間的鏈接很重要——內部鏈接和外部鏈接的力量是毋庸置疑的——你的頁面的主要概念對於機器來說越來越容易確定,引擎需要提高效率,為什麼不從屬性系統中啟發自己重新創建一個規範的系統來簡化分析和分類,然後讓它被所有開發人員採用?
語義標記對引擎很重要,它們盡最大努力讓我們大量採用它。 我們有“AuthorRank”、麵包屑、豐富片段、知識圖譜、答案框; 有了 schema.org 和 HTML5,現在有了以驚人的精確度描述任何物理實體的語法。
您的網站未標記為 schema.org!
確實,在深度技術優化和未來主義主題之間,你很快就做出了選擇。 在您的 OnCrawl 審核之後,您必須做出選擇以改善您的網站結構、減少重複內容、優化頁面內部鏈接或語義(術語的語言部分),您是對的,但下一步是什麼?
為您的內容賦予一些意義,享受豐富的內容——這種美麗的優化旨在讓您堅持使用 schema.org 技術,並推動當今搜索領導者創新的主要部分。
查看最後的 AMP(加速移動頁面)建議,了解 Google 吸引我們採用語義標記和 JSON-LD。
享受客戶評論以在答案列表上顯示小星星是最低限度的,標記您的站點地圖必須是一種習慣,但今天您可以走得更遠。
語義標記已經準備好被大規模使用,但我們應該保留哪些利潤?
為什麼要標記實體? 對於藝術之美,因為對於我們許多人來說,它是真正的動力源泉。 獲得豐富的片段並與競爭對手不同,但這只會持續片刻。 培訓開發人員掌握一種語法,該語法應該成為未來機器之間交互的基礎——這已經更具吸引力了。 簡化引擎對您網站的理解工作,並使用最合適的語言來引誘爬蟲或索引。
最大限度地簡化您的數據,在您的頁面之間創建強大的語義鏈接,這是您的新優先事項。
以汽車為例,https://schema.org/Car 具有長度、寬度、轉向角、顏色、後排座椅數量、後備箱空間等屬性。 它的品牌同時是一個屬性和一個類型實體 https://schema.org/Brand 擁有自己的屬性。 這個名為的汽車實體也由一個引擎 https://schema.org/EngineSpecification 組成,它是一個具有自己的架構、自己的屬性的全局實體,由 https://schema.org/AutoDealer 出售,作為https://schema.org/LocalBusiness,具有開放時間、實際地址以及與其類型相關的更多其他信息。 所有這些數據都可以通過 schema.org 詞彙表進行描述,並且將越來越多地被引擎使用以提供可見性。
可能性是無限的,不要再錯過這種優化,它將改善您的內容和網站的質量。
內容為王,鏈接為王,技術為王