Breadcrumb SEO, Python 3 ve Oncrawl: otomasyon yolunda!

Yayınlanan: 2021-04-14

OnCrawl ve Python 3 ile otomatik olarak kırıntı tabanlı bir segmentasyonun nasıl oluşturulacağını öğrenelim.

Oncrawl'da segmentasyon nedir?

Oncrawl, bir dizi sayfayı gruplara ayırmak için segmentasyonları kullanır. Bu, tarama verilerini Google Analytics, Google Search Console, AT Internet, Adobe Analytics veya geri bağlantılar için Majestic ile harmanlayan tarama raporlarından, günlük analizinden ve diğer çapraz analiz raporlarından gelen verileri analiz etmeyi çok kolaylaştırır.

Segmentasyonlar oluşturmak neden önemlidir?

Taramanız tamamlandıktan sonra, yapılacak en önemli şey özel bir segmentasyon oluşturmaktır. Bu, analizleri sitenize ve yapısına en uygun perspektiften okumanızı sağlar.

Sitenizin sayfalarını segmentlere ayırmanın birçok yolu vardır ve bunu yapmanın doğru ya da yanlış bir yolu yoktur. Örneğin, URL yapısına göre sitenizin yapısını takip etmek mümkündür.

Örneğin, bu tür " https://www.mydomain.com/news/canada/politics " URL'si şu şekilde kolayca bölümlere ayrılabilir:

  • Ana Sayfayı izole etmek için bir grup
  • Tüm haberler için bir grup
  • Kanada dizini için bir alt grup
  • Politika dizini için bir alt grup

Gördüğünüz gibi, segmentasyonlarınız için 3'e kadar derinlik seviyesi oluşturmak mümkün. Bu, segmentasyonları değiştirmek zorunda kalmadan SEO analizinizde belirli gruplara veya alt gruplara odaklanmanıza olanak tanır.

Temel bir segmentasyonu nasıl oluşturabilirim?

Oncrawl'ın ilk segmentasyonu oluşturma işini tek başına üstlendiğini bilmelisiniz. Bu, "İlk yol" veya URL'lerde karşılaşılan ilk dizine dayanmaktadır.
Bu, taramanız tamamlanır tamamlanmaz bir analize sahip olmanızı sağlar.
Bu segmentasyon sitenizin yapısını yansıtmıyor olabilir veya siz olayları farklı bir açıdan incelemek istiyor olabilirsiniz.
Dolayısıyla, Oncrawl Query Language anlamına gelen OQL dediğimiz şeyi kullanarak yeni bir segmentasyon oluşturacaksınız. Bir nevi SQL gibi, sadece çok daha basit ve daha sezgisel:

VE/VEYA koşul operatörlerini olabildiğince kesin olarak kullanmak da mümkündür:

Sayfalarımı farklı yöntemler kullanarak segmentlere ayırma

Diğer KPI'ları kullanma

URL'lere dayalı segmentasyonlar iyidir, ancak /car-rental/ ile başlayan ve H1'i “ Araç kiralama acenteleri ” ifadesini içeren URL'leri gruplama gibi diğer KPI'ları ve H1'in olacağı başka bir grubu da birleştirebilseydik mükemmel olurdu. “ Yardımcı kiralama acenteleri ”, bu mümkün mü?

Evet mümkün! Segmentasyonlarınızı oluştururken, yalnızca tarayıcıdan gelenler değil, aynı zamanda bağlayıcılardan gelenler de dahil olmak üzere kullandığımız tüm KPI'lara sahip olursunuz. Bu, segmentasyonların oluşturulmasını çok güçlü kılar ve tamamen farklı analiz açılarına sahip olmanızı sağlar!

Örneğin, Google Arama Konsolu bağlayıcısı sayesinde URL'lerin ortalama konumunu kullanarak bir segmentasyon oluşturmayı seviyorum.

Bu şekilde, yapımın derinliklerinde hala çalışan URL'leri veya Google'ın 2. sayfasında bulunan ana sayfama yakın URL'leri kolayca tanımlayabilirim.

Bu sayfaların yinelenen içeriği olup olmadığını, boş bir başlık etiketi olup olmadığını, yeterli bağlantı alıp almadıklarını görebiliyorum… Googlebot'un bu sayfalarda nasıl davrandığını da görebiliyorum. Tarama frekansı iyi mi kötü mü? Kısacası, SEO'm ve yatırım getirisi üzerinde gerçek bir etkisi olacak kararları önceliklendirmeme ve vermeme yardımcı oluyor.

Tarama Verileri³

Ek veri kümelerine sorunsuz bağlantılarla analizinizi genişletin. CRM, izleme çözümü veya başka herhangi bir kaynaktan gelen geri bağlantılar, SEO trafiği, sıralamalar ve özel veri kümeleri hakkındaki verilere dayalı olarak SEO stratejinizi analiz edin.
Daha fazla bilgi edin

Veri Alımı Kullanma

Veri Alma özelliğimize aşina değilseniz, öncelikle sizi konuyla ilgili bu makaleyi okumaya davet ediyorum. Bu, Oncrawl'a harici veri kaynakları eklemenize izin veren çok güçlü başka bir araçtır.
Örneğin SEMrush, Ahrefs, Babbar.tech'ten veri ekleyebilirsiniz… Avantajı, sayfalarınızı bu araçlardan alınan metriklere göre gruplandırabilir ve ilginizi çeken veriler üzerinden, ilginizi çekmese de analizlerinizi gerçekleştirebilirsiniz. doğal olarak Oncrawl'da.

Son zamanlarda küresel bir otel grubuyla çalıştım. Otel kayıtlarının doğru doldurulup doldurulmadığını, resim, video, içerik vb. olup olmadığını öğrenmek için dahili bir puanlama yöntemi kullanırlar. Tarama ve günlük dosyası verilerini çapraz analiz etmek için kullandığımız tamamlanma yüzdesini belirlerler.

Sonuç, Googlebot'un doğru doldurulmuş sayfalarda daha fazla zaman geçirip geçirmediğini, %90'ın üzerinde puan alan bazı sayfaların çok derin olup olmadığını, yeterli bağlantı alamadığını bilmemizi sağlar… puan, sayfalar ne kadar çok ziyaret alırsa, Google tarafından o kadar çok keşfedilir ve Google SERP'deki konumları o kadar iyi olur. Otelcileri otel listelerini doldurmaya teşvik etmek için durdurulamaz bir argüman!

SEO kırıntı izine dayalı bir segmentasyon oluşturun

Bu makalenin konusu bu, o yüzden konunun özüne geçelim. URL'lerin yapısı belirli bir dizine sayfa eklemiyorsa, sitenizin sayfalarını bölümlere ayırmak bazen zordur. Bu, genellikle ürün sayfalarının hepsinin kökünde olduğu e-ticaret sitelerinde geçerlidir. Bu nedenle, bir sayfanın hangi gruba ait olduğunu URL'den bilmek imkansızdır.
Sayfaları birlikte gruplandırmak için ait oldukları grubu tanımlamanın bir yolunu bulmalıyız. Bu nedenle, Oncrawl tarafından sunulan Kazıyıcı işlevini kullanarak her bir URL'nin içerik haritası seo izini alma ve bunları ekmek kırıntıları seo'sundaki değerlere göre sınıflandırma fikrimiz vardı.

Oncrawl ile SEO Breadcrumb Kazıma

Yukarıda gördüğümüz gibi, kırıntı izini almak için bir kazıma kuralı oluşturacağız. Çoğu zaman oldukça basittir çünkü gidip bir div içindeki bilgileri alabiliriz, o zaman her seviyenin alanları
ul ve li listeleri:

Bazen de Breadcrumb yapılandırılmış veri tipi sayesinde bilgiye kolayca ulaşabiliyoruz. Böylece her pozisyon için “name” alanının değerini almak kolay olacaktır.

İşte kullandığım bir kazıma kuralı örneği:

Veya bu kural: //li[contains(@class, "current-menu-ancestor") or contains(@class, "current-menu-parent") or contains(@class, "current-menu-item")]/a/text()

Bu yüzden, Xpath ile tüm span itemprop=”title” ifadesini alıyorum, ardından “> bu bir > karakter değil”den sonraki her şeyi çıkarmak için normal bir ifade kullanıyorum. Regex hakkında daha fazla bilgi edinmek istiyorsanız, konuyla ilgili bu makaleyi ve Regex hakkındaki Cheat sayfamızı okumanızı öneririm.

Çıktı olarak bunun gibi birkaç değer alıyorum:

Test edilen URL için 3 değer içeren bir "Breadcrumb" alanım olacak:

  • Erkek adam
  • Polo bluz
  • Kısa kollu polo
 json'u içe aktar
rastgele içe aktar
içe aktarma istekleri

# Yetkili
# x-oncrawl-token ile tarayıcıdan istek üstbilgilerini alabileceğinizden iki yol
# veya burada api belirteci ile: https://app.oncrawl.com/account/tokens
API_ACCESS_TOKEN = ' '
# Bir içerik haritası özel alanının olduğu yerde gezinme kimliğini ayarlayın
YAVAŞ İLERLEME_
# Segmentasyonda almak istemediğiniz yasak içerik haritası öğelerini güncelleyin
FORBIDDEN_BREADCRUMB_ITEMS = ('Accueil',)
FORBIDDEN_BREADCRUMB_ITEMS_LIST = [
                                 v.şerit() 
                                 FORBIDDEN_BREADCRUMB_ITEMS.split(',') içindeki v için
                                 ]



tanım rastgele_renk():
    random_number = random.randint(0, 16777215)
    hex_number = str(hex(rastgele_sayı))
    hex_number = hex_number[2:].ljust(6, '0')
    f'#{hex_number}' döndür


def değer_grubuna(değer):
    dönüş {
        'renk': rastgele_renk(),
        'isim': değer,
        'oql': {'veya': [{'field': ['custom_Breadcrumb', 'eşittir', değer]}]}
    }


def walk_dict(sözlük, seviye=0):
    geri = {
        "simge": "gösterge tablosu",
        "transposable": Yanlış,
        "isim": "Ekmek kırıntısı"
    }

Artık kural tanımlandığına göre, taramamı başlatabilirim ve Oncrawl, içerik haritası değerlerini otomatik olarak alacak ve taranan her URL ile ilişkilendirecektir.

Python ile çok seviyeli segmentasyonun oluşturulmasını otomatikleştirin

Artık her URL için tüm SEO kırıntı değerlerine sahip olduğum için, otomatik olarak Oncrawl ile uyumlu bir segmentasyon oluşturmak için bir Google Colab'da bir seo otomasyon python betiği kullanacağız.

Komut dosyasının kendisi için 3 kitaplık kullanıyoruz:

  • json (Json ile yazılmış segmentasyonumuzu oluşturmak için)
  • csv
  • rastgele (Her grup için onaltılık renk kodları oluşturmak için)

Komut dosyası başlatıldığında, projenizde segmentasyonun oluşturulmasıyla otomatik olarak ilgilenir!

Analizlerde veri önizlemesi

Artık segmentasyonumuz oluşturulduğuna göre, kırıntı izime dayalı segmentli bir görünümle farklı analizlere erişmek mümkün.

Sayfaların grup ve derinliğe göre dağılımı


Sıralama performansı (GSC)


Googlebot tarama sıklığı


SEO ziyaretleri ve aktif sayfa oranı


Kullanıcıların karşılaştığı durum kodları ve SEO oturumları


Googlebot'un karşılaştığı durum kodlarının izlenmesi


Sıralama Dağılımı

Ve işte buradayız, Python ve OnCrawl kullanan bir betik sayesinde otomatik olarak bir segmentasyon oluşturduk. Artık tüm sayfalar, içerik haritası izine göre gruplandırılmıştır ve bu, 3 derinlik düzeyinde:

Avantajı, artık her grup ve sayfa alt grubu için farklı KPI'ları (Tarama, derinlik, dahili bağlantılar, Tarama bütçesi, SEO oturumları, SEO ziyaretleri, Sıralama performansları, Yükleme Süresi) izleyebilmemizdir.

Oncrawl ile SEO'nun geleceği

Muhtemelen bu "kullanıma hazır" bir yeteneğe sahip olmanın harika olduğunu düşünüyorsunuz, ancak bunların hepsini yapmak için mutlaka zamanınız yok. İyi haber şu ki, bu özelliği yakın gelecekte doğrudan entegre etmek için çalışıyoruz.

Bu, kısa bir süre sonra, basit bir tıklama ile Data Ingest'ten hurdaya çıkarılan herhangi bir alan veya alan üzerinde otomatik olarak bir segmentasyon oluşturabileceğiniz anlamına gelir. Ve bu size çok zaman kazandıracak ve inanılmaz kesitsel SEO analizi yapmanıza izin verecektir.

Sayfalarınızın kaynak kodundan herhangi bir veriyi sıyırabildiğinizi veya her bir URL için herhangi bir KPI'yı entegre edebileceğinizi hayal edin. Tek sınır hayal gücünüz!

Örneğin ürünlerin satış fiyatını alıp fiyata göre derinlik, Inrank, backlink, tarama bütçesini görebilirsiniz.

Ancak medya makalelerinizin yazarlarının adlarını da alabilir ve kimin en iyi performansı gösterdiğini ve en iyi sonucu veren yazma yöntemlerini uyguladığını görebiliriz.

Ürünlerinizin incelemelerini ve puanlarını alabilir ve en iyi ürünlerin en az tıklamayla erişilebilir olup olmadığını, yeterli bağlantı alıp almadığını, geri bağlantılara sahip olup olmadığını, Googlebot tarafından iyi taranıp taranmadığını görebiliriz.

Ciro, marj, dönüşüm oranı, Google Ads harcamalarınız gibi işletme verilerinizi entegre edebiliriz.

Şimdi, analizinizi genişletmek ve doğru SEO kararlarını vermek için verileri nasıl çapraz referans alabileceğinizi hayal etmek size kalmış.

Otomatik segmentasyonu kırıntı izinde test etmek ister misiniz? Doğrudan Oncrawl içinden sohbet kutusu aracılığıyla bizimle iletişime geçin.

Emeklemenin tadını çıkar!

ÜCRETSİZ deneme sürümünü başlat