Google Nasıl Çalışır: Bir Google Sıralama Mühendisinin Hikayesi #SMX
Yayınlanan: 2022-06-12Google Yazılım Mühendisi Paul Haahr, 14 yılı aşkın süredir Google'da çalışmaktadır. İkisi için Matt Cutts ile bir ofisi paylaştı. Google'ın nasıl çalıştığını bir Google mühendisinin bakış açısıyla paylaşmak için SMX West 2016 aşamasını alıyor – veya en azından 30 dakika içinde olabildiğince çok şey paylaşıyor. Ardından, Web Yöneticisi Eğilimleri Analisti Gary Illyes sahnede ona katılacak ve ikisi, Arama Motoru Arazi Editörü Danny Sullivan'ın moderatörlüğünde SMX izleyicilerinden gelen soruları yanıtlayacak (Soru-Cevap bölümüne geçin!).

Google Nasıl Çalışır?
Haahr, bize Google mühendislerinin ne yaptığını anlatarak açılıyor. İşleri şunları içerir:
- Aramalar için kod yazma
- Metrikleri optimize etme
- Yeni sinyaller aranıyor
- Eski sinyalleri yeni yollarla birleştirmek
- İyi derecelendirmelere sahip sonuçları yukarı taşımak
- Kötü derecelendirmelere sahip sonuçları aşağı kaydırma
- Derecelendirme yönergelerini düzeltme
- Gerektiğinde yeni metrikler geliştirmek
Bir arama motorunun iki bölümü:
- Zamanın ilerisinde (sorgudan önce)
- Sorgu işleme
Sorgudan Önce
- Web'i tarayın
- Taranan sayfaları analiz edin
- Bağlantıları ayıkla
- İçeriği oluştur
- Anlambilime açıklama ekleyin
- Bir dizin oluşturun
İçerik
- Bir kitabın indeksi gibi
- Her kelime için, üzerinde göründüğü sayfaların bir listesi
- Milyonlarca sayfalık gruplara bölünmüş
- Artı belge başına meta veriler
Sorgu İşleme
- Sorgu anlama ve genişletme
Sorgu bilinen herhangi bir varlığı adlandırıyor mu? - Alma ve puanlama
- Sorguyu tüm parçalara gönder
Her parça- Eşleşen sayfaları bulur
- Sorgu+sayfası için bir puan hesaplar
- En üstteki N sayfasını puana göre geri gönderir
- Tüm üst sayfaları birleştirin
- Puana göre sırala
- Sorguyu tüm parçalara gönder
- Alma sonrası ayarlamalar
- Ana bilgisayar kümeleme
- çoğaltma var mı
Puanlama Sinyalleri
Bir sinyal:
- Puanlamada kullanılan bir bilgi parçası
- Sorgudan bağımsız – bir sayfanın özelliği
- Sorguya bağlı
Metrikler
“Ölçemezseniz iyileştiremezsiniz” - Lord Kelvin
- alaka
- Bir sayfa, kullanıcının sorgusuna faydalı bir şekilde yanıt veriyor mu?
- Sıralamanın en üst sıradaki metriği
- Kalite
- Gösterdiğimiz sonuçlar ne kadar iyi
- Sonuç zamanı (daha hızlı daha iyidir)
Google, canlı deneylerle kendini ölçer:
- Gerçek trafik üzerinde A/B denemeleri
- Tıklama kalıplarındaki değişiklikleri arayın
- Bir denemede çok fazla trafik var
Bir zamanlar Google, hangisinin en iyi olduğunu görmek için 41 farklı blues test etti.
Google ayrıca insan değerlendirici deneyleri de yapar:
- Gerçek kişilere deneysel arama sonuçlarını göster
- Sonuçların nasıl olduğunu sorun
- Puanlayıcılar arasında toplam puanlar
- Değerlendiriciler için kriterleri açıklayan yönergeler yayınlayın
- Araçlar bunu Mechanical Turk'e benzer şekilde otomatik bir şekilde yapmayı destekler
Google, sayfaları iki ana faktöre göre değerlendirir:
- İhtiyaçlar Karşılandı (cep telefonu önde ve merkezde)
- Sayfa Kalitesi
İhtiyaçlar Karşılandı notları:
- Tam karşılar
- Çok İyi Karşılıyor
- Yüksek Karşılar
- Orta derecede Karşılar
- Biraz Karşılıyor
- Buluşamadı
Sayfa kalitesi kavramları:
- uzmanlık
- bir otoriterlik
- T paslanma
Google mühendis geliştirme süreci:
- Fikir
- Hazır olana kadar tekrarlayın
- kod yaz
- Veri oluştur
- Deneyleri çalıştır
- analiz et
- Kantitatif analist tarafından lansman raporu
- İncelemeyi başlat
- Başlatmak
Ne yanlış gidiyor?
İki tür sorun vardır:

- Sistematik olarak kötü derecelendirmeler
- Metrikler, önemsediğimiz şeyleri yakalamaz
İşte kötü bir derecelendirme örneği. Birisi [Texas çiftlik gübresi] için arama yapar ve arama sonucu, üreticinin genel merkezini gösteren bir harita sağlar. İstedikleri şeyin bu olması pek olası değil. Google bunu canlı deneylerle belirler. Bir değerlendirici, haritaları görür ve ihtiyaçları "Yüksek Derecede Karşılar" olarak derecelendirirse, bu, derecelendirme noktasında bir başarısızlıktır.
Ya metrikler eksikse? 2009-2011'de düşük kaliteli içerikle ilgili çok sayıda şikayet vardı. Ancak içerik çiftlikleri nedeniyle alaka düzeyi ölçümleri yükselmeye devam etti. Sonuç: Google olması gereken metrikleri ölçmüyordu. Böylece, kalite metriği alaka düzeyi dışında geliştirildi.
İşte Paul Haahr'ın bir göz atmaya değer slayt destesi:
7/19 Güncellemesi: Sunum şimdi yazar tarafından özel olarak işaretlendi.
Gary Illyes ve Paul Haahr, SMX İzleyicilerinden Gelen Soruları Yanıtlıyor
SMX: RankBrain tüm bunlara nasıl uyuyor?
Haahr: RankBrain sinyallerin bir alt kümesini görüyor. RankBrain'in nasıl çalıştığı hakkında çok fazla ayrıntıya giremem. Nasıl çalıştığını anlıyoruz ama ne yaptığı kadar değil. Derin öğrenme hakkında yayınladığımız birçok şeyi kullanır.
RankBrain bir sayfanın otoritesini nasıl bilebilir?
Haahr: Hepsi aldığı eğitimin bir işlevi. Sorguları ve diğer sinyalleri görür. Faydalı olacağını pek fazla söyleyemem.
SMX: Bir Google uygulamasında oturum açtığınızda, topladığınız bilgilerle farklılaşıyor musunuz? Google Asistan ve Chrome karşılaştırmasındaysanız, bu gördüklerinizi etkileyebilir mi?
Haahr: Bu gerçekten giriş yapıp yapmadığınızla ilgili bir soru. Tutarlı bir deneyim sunuyoruz. Göz atma geçmişiniz sizi ikisinden birine kadar takip eder.
Google, aynı sorgular için günün farklı saatlerinde farklı sonuçlar mı veriyor?
Illyes: Emin değilim. Örneğin Haritalar'da, haritalarla ilgili bir şey görüntülersek saatleri gösteririz. Gary'nin bildiği kadarıyla, ortaya çıkan şeyi değiştirmez.
SMX: Panda ve Penguin'e neler oluyor?
Illyes: Penguin hakkında bir tarih veya zaman çizelgesi vermekten vazgeçtim. Üzerinde çalışıyoruz, nasıl başlatacağımızı düşünüyoruz, ama açıkçası bir tarih bilmiyorum ve bir tarih söylemek istemiyorum çünkü zaten üç ya da dört kez yanıldım ve bu iş için kötü.
SMX: Google Yazarlığı Sonrası, yazar yetkisini nasıl izliyorsunuz?
Haahr: Orada hiçbir ayrıntıya girmeyeceğim. Söyleyeceğim şey, değerlendiricilerin gördükleri bir sayfa için bunu manuel olarak gözden geçirmeleri bekleniyor. Ölçtüğümüz şey şudur: Değerlendiricilerin iyi otoriteler olduğunu düşündüğü sonuçlara hizmet etme konusunda iyi bir iş çıkarabiliyor muyuz?
SMX: Bu, otoritenin doğrudan veya dolaylı bir faktör olarak kullanıldığı anlamına mı geliyor?
Haahr: Evet veya hayır diyemem. Bundan çok daha karmaşık ve doğrudan bir cevap veremem.
SMX: Müstehcen yazarlık sona erdiğinde, Google bylines'a sahip olmaya devam edeceğini söyledi. rel=author ile hiç uğraşmalı mısınız?
Illyes: Gelecekteki gelişmeler adına rel=author etiketini kullanmayı hala arayan en az bir ekip var. Bir SEO olsaydım, yine de etiketi bırakırdım. Ona sahip olmaktan zarar gelmez. Ancak yeni sayfalarda, muhtemelen buna değmez. Yine de gelecekte bir şey için kullanabiliriz.
SMX: Şu anda ne okuyorsun?
Haahr: Çok fazla gazetecilik ve çok az kitap okudum. Ancak, “City on Fire”ı yeni bitirdim – 70'lerde New York hakkında. 900 sayfa var ve bittiğinde hayal kırıklığına uğradım. "Bu Burada Olmaz"a daha yeni başladım.