Gizli Semantik İndeksleme Nedir ve Nasıl Çalışır?
Yayınlanan: 2020-04-02Gizli Semantik İndeksleme (LSI), arama pazarlamacıları arasında uzun süredir tartışma konusu olmuştur. Google'da 'gizli anlamsal indeksleme' terimini kullanın ve hem savunucular hem de şüpheciler ile eşit ölçüde karşılaşacaksınız. LSI'yı arama motoru pazarlaması bağlamında değerlendirmenin faydaları konusunda net bir fikir birliği yoktur. Konsepte aşina değilseniz, bu makale LSI hakkındaki tartışmayı özetleyecektir, böylece SEO stratejiniz için ne anlama geldiğini umarsınız.
Gizli Semantik İndeksleme Nedir?
LSI, Doğal Dil İşleme'de (NLP) bulunan bir işlemdir. NLP, makinelerin insan dilini nasıl yorumladığına odaklanan, dilbilim ve bilgi mühendisliğinin bir alt kümesidir. Bu çalışmanın önemli bir parçası dağıtım semantiğidir. Bu model, büyük veri kümelerinde benzer bağlamsal anlamlara sahip kelimeleri anlamamıza ve sınıflandırmamıza yardımcı olur.
1980'lerde geliştirilen LSI, bilgi alımını daha doğru hale getiren matematiksel bir yöntem kullanır. Bu yöntem, kelimeler arasındaki gizli bağlamsal ilişkileri belirleyerek çalışır. Bunu şu şekilde parçalamanıza yardımcı olabilir:
- Gizli → Gizli
- Semantik → Kelimeler Arasındaki İlişkiler
- İndeksleme → Bilgi Alma
Gizli Semantik İndeksleme Nasıl Çalışır?
LSI, Tekil Değer Ayrıştırmasının (SVD) kısmi uygulamasını kullanarak çalışır. SVD, basit ve verimli hesaplamalar için bir matrisi bileşenlerine indirgeyen matematiksel bir işlemdir.
Bir sözcük dizisini analiz ederken, LSI, bitiş sözcükleri olarak da bilinen bağlaçları, zamirleri ve yaygın fiilleri kaldırır. Bu, bir tümcenin ana 'içeriğini' oluşturan kelimeleri izole eder. İşte bunun nasıl görünebileceğine dair hızlı bir örnek:
Bu kelimeler daha sonra bir Dönem Belgesi Matrisine (TDM) yerleştirilir. Bir TDM, bir veri seti içindeki belgelerde her belirli kelimenin (veya terimin) ortaya çıkma sıklığını listeleyen 2B bir ızgaradır.
Tartım fonksiyonları daha sonra TDM'ye uygulanır. Basit bir örnek, kelimeyi 1 değerine sahip tüm belgeleri ve 0 değerine sahip olmayanları sınıflandırmaktır. Bu belgelerde kelimeler aynı genel sıklıkta geçtiğinde, buna birlikte bulunma denir. Aşağıda, bir TDM'nin temel bir örneğini ve birden çok kelime öbeğinde birlikte meydana gelmeyi nasıl değerlendirdiğini bulacaksınız:
SVD'yi kullanmak, tüm belgelerde kelime kullanımındaki kalıpları tahmin etmemizi sağlar. LSI tarafından üretilen SVD vektörleri, anlamı tek tek terimleri analiz etmekten daha doğru bir şekilde tahmin eder. Sonuç olarak, LSI, belirli bir bağlamda anlamlarını veya anlamlarını daha iyi anlamak için kelimeler arasındaki ilişkileri kullanabilir.
[Örnek Olay] Sayfa içi SEO ile yeni pazarlarda büyüme sağlamak
Gizli Semantik İndeksleme SEO ile nasıl ilgilendi?
Google, oluşum yıllarında, arama motorlarının web sitelerini belirli bir anahtar kelimenin sıklığına göre sıraladığını keşfetti. Ancak bu, en alakalı arama sonucunu garanti etmez. Bunun yerine Google, güvenilir bilgi hakemleri olarak gördükleri web sitelerini sıralamaya başladı.
Zamanla, Google'ın algoritmaları düşük kaliteli ve alakasız web sitelerini daha doğru bir şekilde filtreleyecektir. Bu nedenle, pazarlamacılar, kullanılan tam kelimelere güvenmek yerine, bir aramanın arkasındaki anlamı anlamalıdır. Bu nedenle Roger Montti, modası geçmiş SEO inançlarıyla ilgili bir makalede LSI'yi "arama motorları için eğitim çarkları" olarak tanımladı ve LSI'nin "bugün arama motorlarının web sitelerini nasıl sıraladığıyla çok az ila sıfır alaka" olduğunu ekledi.
Bir arama sorgusunun anlamı, arkasındaki niyetle yakından bağlantılıdır. Google, Arama Kalitesi Değerlendirici Yönergeleri adlı bir belgeye sahiptir. Bu yönergelerde, kullanıcı amacı için dört yararlı kategori tanıtılmaktadır:
- Sorguyu Bil – Bu, bir konu hakkında bilgi aramayı temsil eder. Bunun bir varyantı, kullanıcıların belirli bir yanıtı göz önünde bulundurarak arama yaptığı 'Basit Bil' sorgusudur.
- Sorgu Yap – Bu, çevrimiçi satın alma veya indirme gibi belirli bir etkinliğe katılma isteğini yansıtır. Tüm bu sorgular bir 'etkileşim' duygusuyla tanımlanabilir.
- Web Sitesi Sorgusu – Bu, kullanıcıların belirli bir web sitesini veya sayfayı aradığı zamandır. Bu aramalar, belirli bir web sitesi veya markanın önceden bilindiğini gösterir.
- Şahsen Ziyaret Sorgusu – Kullanıcı, gerçek mekanda faaliyet gösteren bir mağaza veya restoran gibi fiziksel bir yer arıyor.
LSI'nin arkasındaki teori - bir kelimenin bağlamsal anlamını bir cümle içinde tanımlamak - Google'a rekabet avantajı sağladı. Ancak, 'LSI anahtar kelimelerinin' aniden SEO başarısı için altın bir bilet olduğu fikri yayılmaya başladı.
'LSI Anahtar Kelimeleri' gerçekten var mı?
Birçok kayda değer yayın, LSI anahtar kelimelerinin sıkı savunucuları olmaya devam ediyor. Yine de Google'ın Web Yöneticisi Eğilimleri Analisti John Mueller gibi bazı kaynaklar bunların bir efsane olduğunu belirtiyor. Bu kaynaklar aşağıdaki noktaları yükseltmeye başladı:
- LSI, World Wide Web'den önce geliştirildi ve bu kadar büyük ve dinamik bir veri kümesine uygulanması amaçlanmamıştı.
- 1989'da Bell Communications Research Inc. adlı bir kuruluşa verilen Gizli Semantik İndeksleme üzerine ABD patentinin süresi 2008'de sona erecekti. Bu nedenle, Bill Slawski'ye göre, Google'ın LSI kullanması, 'bağlanmak için akıllı bir telgraf cihazı kullanmaya' benzer olacaktır. mobil web.
- Google, metin hacimlerini "vektörlere" - bilgisayarların yazılı dili anlamasına yardımcı olan matematiksel varlıklara - dönüştüren bir makine öğrenimi yöntemi olan RankBrain'i kullanır. RankBrain, web'i sürekli genişleyen bir veri kümesi olarak barındırır ve LSI'nin aksine onu Google tarafından kullanılabilir hale getirir.
Sonuç olarak, LSI, pazarlamacıların uyması gereken bir gerçeği ortaya koyuyor: Bir kelimenin benzersiz bağlamını keşfetmek, içeriğin içine doldurulmuş anahtar kelimelerden daha iyi kullanıcı amacını anlamamıza yardımcı olur. Ancak bu, Google'ın LSI'ya göre sıralandığını mutlaka doğrulamaz. Bu nedenle, LSI'nin SEO'da kesin bir bilimden ziyade bir felsefe olarak çalıştığını söylemek güvenli olabilir mi?
Roger Montti'nin LSI hakkındaki “arama motorları için eğitim çarkları” şeklindeki alıntısına dönelim. Bisiklete binmeyi öğrendikten sonra, eğitim tekerleklerini çıkarma eğilimindesiniz. 2020'de Google'ın artık eğitim çarkları kullanmadığını varsayabilir miyiz?
Google'ın son algoritma güncellemesini düşünebiliriz. Ekim 2019'da Aramadan Sorumlu Başkan Yardımcısı Pandu Nayak, Google'ın BERT (Transformers'dan Çift Yönlü Kodlayıcı Temsilleri) adlı bir yapay zeka sistemini kullanmaya başladığını duyurdu. Tüm arama sorgularının %10'undan fazlasını etkileyen bu, son yıllardaki en büyük Google güncellemelerinden biridir.
Bir arama sorgusunu analiz ederken, BERT tek bir kelimeyi o kelime öbeğindeki tüm kelimelere göre değerlendirir. Bu analiz çift yönlüdür, çünkü belirli bir kelimeden önceki veya sonraki tüm kelimeleri dikkate alır. Tek bir kelimenin kaldırılması, BERT'nin bir ifadenin benzersiz bağlamını nasıl anladığını büyük ölçüde etkileyebilir.
Bu, analizinden herhangi bir durdurma kelimesini çıkaran LSI'dan bir tezat oluşturuyor. Aşağıdaki örnek, durma sözcüklerini kaldırmanın bir ifadeyi nasıl anladığımızı nasıl değiştirebileceğini gösterir:
Durdurma kelimesi olmasına rağmen, 'bul', 'yüz yüze ziyaret' sorgusu olarak tanımlayacağımız aramanın en önemli noktasıdır.
Peki pazarlamacılar ne yapmalı?
Başlangıçta, LSI'nin Google'ın içeriği alakalı sorgularla eşleştirmesine yardımcı olabileceği düşünülüyordu. Ancak, pazarlamada LSI kullanımını çevreleyen tartışmanın henüz tek bir sonuca varmadığı görülüyor. Buna rağmen, pazarlamacılar çalışmalarının stratejik olarak alakalı kalmasını sağlamak için hala birçok adım atabilir.
İlk olarak, makaleler, web kopyası ve ücretli kampanyalar, eş anlamlıları ve varyantları içerecek şekilde optimize edilmelidir. Bu, benzer niyete sahip kişilerin dili farklı şekilde kullanma biçimlerini açıklar.
Pazarlamacılar otorite ve netlikle yazmaya devam etmelidir. İçeriklerinin belirli bir sorunu çözmesini istiyorlarsa bu mutlak bir zorunluluktur. Bu sorun, bilgi eksikliği veya belirli bir ürün veya hizmete duyulan ihtiyaç olabilir. Pazarlamacılar bunu bir kez yaptıklarında, kullanıcının amacını gerçekten anladıklarını gösterir.
Son olarak, yapılandırılmış verileri de sık sık kullanmaları gerekir. Bir web sitesi, yemek tarifi veya SSS olsun, yapılandırılmış veriler, Google'ın ne taradığını anlaması için bağlam sağlar.