Google Nasıl Çalışır: Bir Google Sıralama Mühendisinin Hikayesi #SMX

Yayınlanan: 2022-06-12

Google Yazılım Mühendisi Paul Haahr, 14 yılı aşkın süredir Google'da çalışmaktadır. İkisi için Matt Cutts ile bir ofisi paylaştı. Google'ın nasıl çalıştığını bir Google mühendisinin bakış açısıyla paylaşmak için SMX West 2016 aşamasını alıyor – veya en azından 30 dakika içinde olabildiğince çok şey paylaşıyor. Ardından, Web Yöneticisi Eğilimleri Analisti Gary Illyes sahnede ona katılacak ve ikisi, Arama Motoru Arazi Editörü Danny Sullivan'ın moderatörlüğünde SMX izleyicilerinden gelen soruları yanıtlayacak (Soru-Cevap bölümüne geçin!).

Soldan: Google Web Yöneticisi Eğilimleri Analisti Gary Illyes, Google Yazılım Mühendisi Paul Haahr ve Arama Motoru Arazi Editörü Danny Sullivan, San Jose'deki SMX West 2016 sahnesinde.

Google Nasıl Çalışır?

Haahr, bize Google mühendislerinin ne yaptığını anlatarak açılıyor. İşleri şunları içerir:

  • Aramalar için kod yazma
  • Metrikleri optimize etme
  • Yeni sinyaller aranıyor
  • Eski sinyalleri yeni yollarla birleştirmek
  • İyi derecelendirmelere sahip sonuçları yukarı taşımak
  • Kötü derecelendirmelere sahip sonuçları aşağı kaydırma
  • Derecelendirme yönergelerini düzeltme
  • Gerektiğinde yeni metrikler geliştirmek

Bir arama motorunun iki bölümü:

  • Zamanın ilerisinde (sorgudan önce)
  • Sorgu işleme

Sorgudan Önce

  • Web'i tarayın
  • Taranan sayfaları analiz edin
    • Bağlantıları ayıkla
    • İçeriği oluştur
    • Anlambilime açıklama ekleyin
  • Bir dizin oluşturun

İçerik

  • Bir kitabın indeksi gibi
  • Her kelime için, üzerinde göründüğü sayfaların bir listesi
  • Milyonlarca sayfalık gruplara bölünmüş
  • Artı belge başına meta veriler

Sorgu İşleme

  • Sorgu anlama ve genişletme
    Sorgu bilinen herhangi bir varlığı adlandırıyor mu?
  • Alma ve puanlama
    • Sorguyu tüm parçalara gönder
      Her parça

      • Eşleşen sayfaları bulur
      • Sorgu+sayfası için bir puan hesaplar
      • En üstteki N sayfasını puana göre geri gönderir
    • Tüm üst sayfaları birleştirin
    • Puana göre sırala
  • Alma sonrası ayarlamalar
    • Ana bilgisayar kümeleme
    • çoğaltma var mı

Puanlama Sinyalleri

Bir sinyal:

  • Puanlamada kullanılan bir bilgi parçası
  • Sorgudan bağımsız – bir sayfanın özelliği
  • Sorguya bağlı

Metrikler

“Ölçemezseniz iyileştiremezsiniz” - Lord Kelvin

  • alaka
    • Bir sayfa, kullanıcının sorgusuna faydalı bir şekilde yanıt veriyor mu?
    • Sıralamanın en üst sıradaki metriği
  • Kalite
    • Gösterdiğimiz sonuçlar ne kadar iyi
  • Sonuç zamanı (daha hızlı daha iyidir)

Google, canlı deneylerle kendini ölçer:

  • Gerçek trafik üzerinde A/B denemeleri
  • Tıklama kalıplarındaki değişiklikleri arayın
  • Bir denemede çok fazla trafik var

Bir zamanlar Google, hangisinin en iyi olduğunu görmek için 41 farklı blues test etti.

Google ayrıca insan değerlendirici deneyleri de yapar:

  • Gerçek kişilere deneysel arama sonuçlarını göster
  • Sonuçların nasıl olduğunu sorun
  • Puanlayıcılar arasında toplam puanlar
  • Değerlendiriciler için kriterleri açıklayan yönergeler yayınlayın
  • Araçlar bunu Mechanical Turk'e benzer şekilde otomatik bir şekilde yapmayı destekler

Google, sayfaları iki ana faktöre göre değerlendirir:

  • İhtiyaçlar Karşılandı (cep telefonu önde ve merkezde)
  • Sayfa Kalitesi

İhtiyaçlar Karşılandı notları:

  • Tam karşılar
  • Çok İyi Karşılıyor
  • Yüksek Karşılar
  • Orta derecede Karşılar
  • Biraz Karşılıyor
  • Buluşamadı

Sayfa kalitesi kavramları:

  • uzmanlık
  • bir otoriterlik
  • T paslanma

Google mühendis geliştirme süreci:

  • Fikir
  • Hazır olana kadar tekrarlayın
    • kod yaz
    • Veri oluştur
    • Deneyleri çalıştır
    • analiz et
  • Kantitatif analist tarafından lansman raporu
  • İncelemeyi başlat
  • Başlatmak

Ne yanlış gidiyor?

İki tür sorun vardır:

  • Sistematik olarak kötü derecelendirmeler
  • Metrikler, önemsediğimiz şeyleri yakalamaz

İşte kötü bir derecelendirme örneği. Birisi [Texas çiftlik gübresi] için arama yapar ve arama sonucu, üreticinin genel merkezini gösteren bir harita sağlar. İstedikleri şeyin bu olması pek olası değil. Google bunu canlı deneylerle belirler. Bir değerlendirici, haritaları görür ve ihtiyaçları "Yüksek Derecede Karşılar" olarak derecelendirirse, bu, derecelendirme noktasında bir başarısızlıktır.

Ya metrikler eksikse? 2009-2011'de düşük kaliteli içerikle ilgili çok sayıda şikayet vardı. Ancak içerik çiftlikleri nedeniyle alaka düzeyi ölçümleri yükselmeye devam etti. Sonuç: Google olması gereken metrikleri ölçmüyordu. Böylece, kalite metriği alaka düzeyi dışında geliştirildi.

İşte Paul Haahr'ın bir göz atmaya değer slayt destesi:
7/19 Güncellemesi: Sunum şimdi yazar tarafından özel olarak işaretlendi.

Google Nasıl Çalışır: Bir Sıralama Mühendisinin Perspektifi, Arama Pazarlamacılığı Fuarı - SMX'ten Paul Haahr

Gary Illyes ve Paul Haahr, SMX İzleyicilerinden Gelen Soruları Yanıtlıyor

SMX: RankBrain tüm bunlara nasıl uyuyor?

Haahr: RankBrain sinyallerin bir alt kümesini görüyor. RankBrain'in nasıl çalıştığı hakkında çok fazla ayrıntıya giremem. Nasıl çalıştığını anlıyoruz ama ne yaptığı kadar değil. Derin öğrenme hakkında yayınladığımız birçok şeyi kullanır.

RankBrain bir sayfanın otoritesini nasıl bilebilir?

Haahr: Hepsi aldığı eğitimin bir işlevi. Sorguları ve diğer sinyalleri görür. Faydalı olacağını pek fazla söyleyemem.

SMX: Bir Google uygulamasında oturum açtığınızda, topladığınız bilgilerle farklılaşıyor musunuz? Google Asistan ve Chrome karşılaştırmasındaysanız, bu gördüklerinizi etkileyebilir mi?

Haahr: Bu gerçekten giriş yapıp yapmadığınızla ilgili bir soru. Tutarlı bir deneyim sunuyoruz. Göz atma geçmişiniz sizi ikisinden birine kadar takip eder.

Google, aynı sorgular için günün farklı saatlerinde farklı sonuçlar mı veriyor?

Illyes: Emin değilim. Örneğin Haritalar'da, haritalarla ilgili bir şey görüntülersek saatleri gösteririz. Gary'nin bildiği kadarıyla, ortaya çıkan şeyi değiştirmez.

SMX: Panda ve Penguin'e neler oluyor?

Illyes: Penguin hakkında bir tarih veya zaman çizelgesi vermekten vazgeçtim. Üzerinde çalışıyoruz, nasıl başlatacağımızı düşünüyoruz, ama açıkçası bir tarih bilmiyorum ve bir tarih söylemek istemiyorum çünkü zaten üç ya da dört kez yanıldım ve bu iş için kötü.

SMX: Google Yazarlığı Sonrası, yazar yetkisini nasıl izliyorsunuz?

Haahr: Orada hiçbir ayrıntıya girmeyeceğim. Söyleyeceğim şey, değerlendiricilerin gördükleri bir sayfa için bunu manuel olarak gözden geçirmeleri bekleniyor. Ölçtüğümüz şey şudur: Değerlendiricilerin iyi otoriteler olduğunu düşündüğü sonuçlara hizmet etme konusunda iyi bir iş çıkarabiliyor muyuz?

SMX: Bu, otoritenin doğrudan veya dolaylı bir faktör olarak kullanıldığı anlamına mı geliyor?

Haahr: Evet veya hayır diyemem. Bundan çok daha karmaşık ve doğrudan bir cevap veremem.

SMX: Müstehcen yazarlık sona erdiğinde, Google bylines'a sahip olmaya devam edeceğini söyledi. rel=author ile hiç uğraşmalı mısınız?

Illyes: Gelecekteki gelişmeler adına rel=author etiketini kullanmayı hala arayan en az bir ekip var. Bir SEO olsaydım, yine de etiketi bırakırdım. Ona sahip olmaktan zarar gelmez. Ancak yeni sayfalarda, muhtemelen buna değmez. Yine de gelecekte bir şey için kullanabiliriz.

SMX: Şu anda ne okuyorsun?

Haahr: Çok fazla gazetecilik ve çok az kitap okudum. Ancak, “City on Fire”ı yeni bitirdim – 70'lerde New York hakkında. 900 sayfa var ve bittiğinde hayal kırıklığına uğradım. "Bu Burada Olmaz"a daha yeni başladım.

BCI blog bağlantısına abone olun