[Web Semineri Özeti] Orbit'te SEO: Yinelenen içerik üzerine yeni bakış açıları

Yayınlanan: 2019-11-20

Yinelenen içerik üzerine yeni bakış açıları web semineri, SEO in Orbit serisinin son bölümüdür ve 24 Haziran 2019'da yayınlandı. Bu bölümde, yinelenen içerik sorununu araştırırken OnCrawl Ambassador Omi Sido ve Alexis Sanders'a katılın. Şu gibi soruları ele alıyorlar: Sıralama faktörleri ve gelişen arama teknolojileri, yinelenen içeriği ele alma şeklimizi nasıl etkiler? Ve: Web'deki benzer içerik için gelecekte ne var?

SEO in Orbit, SEO'yu uzaya gönderen ilk web semineri dizisidir. Dizi boyunca, en iyi SEO uzmanlarından bazılarıyla teknik SEO'nun bugününü ve geleceğini tartıştık ve en iyi ipuçlarını 27 Haziran 2019'da uzaya gönderdik.

Tekrarını buradan izleyin:

Alexis Sanders'ı Tanıtmak

Alexis Sanders, Merkle'de Teknik SEO Hesap Yöneticisi olarak çalışmaktadır. SEO teknik ekibi, ajansın teknik tavsiyelerinin tüm dikeylerde doğruluğunu, fizibilitesini ve ölçeklenebilirliğini sağlar. Moz bloguna katkıda bulunuyor ve TechnicalSEO.expert yarışmasının ve SEO in the Lab podcast'inin yaratıcısı.

Bu bölüm Omi Sido tarafından ev sahipliği yaptı. Omi, deneyimli bir uluslararası konuşmacıdır ve sektörde mizahı ve izleyicilerin hemen kullanmaya başlayabilecekleri eyleme dönüştürülebilir içgörüler sunma becerisiyle tanınır. Omi, dünyanın en büyük telekomünikasyon ve seyahat şirketlerinden bazılarıyla SEO danışmanlığından HostelWorld ve Daily Mail'de kurum içi SEO yönetimine kadar, karmaşık verilere dalmayı ve parlak noktaları bulmayı seviyor. Şu anda Omi, Canon Avrupa'da Kıdemli Teknik SEO ve OnCrawl Elçisidir.

Yinelenen içerik nedir?

Omi, yinelenen içeriğin aşağıdaki tanımını sağlar:

Aynı (veya farklı) web sitesinde farklı bir URL'de bulunan içeriğe benzer veya buna yakın kopya içerik.

Yinelenen İçerik Cezası Efsanesi

Yinelenen içerik cezası yoktur.

Bu bir performans sorunudur. Bir botun belirli iki URL'ye bakmasını ve bunların yan yana sıralanabilecek iki farklı içerik olduğunu düşünmesini istemiyoruz.

Alexis, bir botun web sitenizi anlamasını Joey'nin Senden Nefret Ettiğim 10 Şey'deki resimleriyle karşılaştırır: Bir botun iki versiyon arasında önemli bir fark bulması imkansızdır.

Bir arama motoru sıralaması durumunda birbiriyle rekabet etmesi gereken iki tam olarak aynı şeye sahip olmaktan kaçınmak istersiniz. Bunun yerine, arama motorlarında sıralanabilecek ve performans gösterebilecek tek, birleştirilmiş bir deneyime sahip olmak istiyorsunuz.

Kullanıcıların ve botların gördükleri arasındaki fark

Bir kullanıcı tek bir ikna edici URL görebilir, ancak bir bot yine de temelde aynı görünen birden çok sürüm görebilir.

– Çok büyük site için tarama bütçesine etkisi

Zillow veya Walmart gibi çok büyük siteler için tarama bütçesi farklı sayfalar için değişebilir.

Alexis'in SMX East'te Frederic Dubut'un sunumuna dayanan 2018 tarihli bir makalesinde tartışıldığı gibi, bütçeler farklı düzeylerde, alt etki alanı düzeylerinde, farklı sunucu düzeylerinde belirlenir. Arama motorları, ister Google ister Bing olsun, kibar tarayıcılar olmak ister; gerçek kullanıcılar için performansı yavaşlatmak istemiyorlar. Performansta bir değişiklik hissettiklerinde geri çekilirler. Bu, yalnızca site düzeyinde değil, farklı düzeylerde ortaya çıkabilir.

Çok büyük bir siteniz varsa, kullanıcılarınızla alakalı en birleştirilmiş deneyimi sunduğunuzdan emin olmak istersiniz.

Yinelenen içerik bir içerik mi yoksa teknik bir sorun mu?

"Yinelenen içerik"teki "içerik" kelimesine rağmen, bu kısmen teknik bir sorundur.

– Tekrarlama kaynakları – [07:50]

Çoğaltmaya neden olabilecek birçok faktör vardır. Kısmi bir liste bile sonsuza kadar uzayabilir:

  • tekrarlayan sayfalar
  • Hazırlama siteleri
  • HTTP ve HTTPS URL'leri
  • Farklı alt alanlar
  • Farklı vakalar
  • Farklı dosya uzantıları
  • sondaki eğik çizgi
  • dizin sayfaları
  • URL parametreleri
  • yönler
  • çeşitler
  • Yazıcı-dostu sürüm
  • giriş sayfası
  • Envanter
  • Ortak içerik
  • Halkla İlişkiler Bültenleri
  • İçeriği yeniden yayınlama
  • intihal içerik
  • Yerelleştirilmiş içerik
  • ince içerik
  • Sadece-görüntüler
  • Dahili site araması
  • Ayrı mobil site
  • Benzersiz olmayan içerik

– Teknik SEO ve içerik arasındaki sorunların dağılımı

Aslında, bu yinelenen içerik kaynakları, teknik ve geliştirme kaynakları ile içerik tabanlı kaynaklar ve bazıları ikisi arasında örtüşen bir bölgeye giren kaynaklar olarak ayrılabilir.

Bu, yinelenen içeriği ekipler arası bir sorun haline getirir ve bu da onu bu kadar ilginç kılan şeyin bir parçasıdır.

Yinelenen içerik nasıl bulunur

Çoğu yinelenen içerik kasıtsızdır. Omi için bu, yinelenen içeriği bulmak ve düzeltmek için içerik ve teknik ekipler arasında ortak bir sorumluluk olduğunu gösterir.

– Omi'nin favori aracı: Grammarly

Grammarly, Omi'nin yinelenen içeriği bulmak için en sevdiği araçtır ve bir SEO aracı bile değildir. İntihal denetleyicisini kullanıyor. İçerik yayıncısından yeni bir içerik parçasının başka bir yerde yayınlanıp yayınlanmadığını kontrol etmesini ister.

– Kasıtsız yinelenen içeriğin hacmi

Kasıtsız kopya içerik sorunu, mühendislerin çok aşina olduğu bir sorundur. Açıkça modası geçmiş olan Bilgi Erişimine Giriş (2008) adlı bir kitapta, o sırada web'in yaklaşık %40'ının kopyalandığını tahmin ettiler.

– Yinelenen içerikle başa çıkmak için stratejilere öncelik vermek

Yinelenen içerikle başa çıkmak için şunları yapmalısınız:

  1. Her içeriğin nereye sığdığını anlamanıza yardımcı olacak kullanıcı yolculuğunuzu bilerek başlayın. Bunu yapmak son derece zor olabilir, özellikle 20 yıl önce web siteleri yapıldığında, ne kadar büyüyeceklerini veya nasıl ölçekleneceklerini bilmediğimiz zamanlarda. Kullanıcınızın yolculuğunun herhangi bir noktasında nerede olduğunu bilmek, sonraki adımlardan bazılarında öncelik vermenize yardımcı olacaktır.
  2. Her içerik türü için bir yer sağlamak için çalışan bir hiyerarşiye ihtiyacınız olacak. Bilgi mimarinizi anlamak, yinelenen içerikle başa çıkma adımlarında gerçekten üst sıralardadır.
  3. Performansı etkileyen yinelenen içeriğe öncelik verin. Yukarıdaki kısmi kaynak listesi, gerçekçi bir şekilde tek seferde saldırabileceğiniz bir şey olamayacak kadar uzun.
  4. %100 yineleme ile uğraşın
  5. Yinelenen içerik sinyali
  6. Çoğaltmanın nasıl ele alınacağı konusunda stratejik seçim yapın: birleştirin, oluşturun, silin, optimize edin
  7. Çalınan içerikle uğraşın

– Araçlar: OnCrawl'da segmentasyonu kullanma

Alexis, web sitenizi OnCrawl'da bölümlere ayırma yeteneğini gerçekten seviyor, bu da sizin için anlamlı olan şeylere dalmanıza olanak tanıyor.

Farklı türdeki sayfaların farklı miktarlarda tekrarı vardır; bu, en çok soruna sahip bölümlerin bir görünümünü elde etmenizi sağlar. Yukarıdaki örnekte, sitenin çok fazla dikkat edilmesi gerekiyor.

– Araçlar: Google arama ve GSC

Ayrıca arama motorunun kendisini kullanarak yinelenen içeriği kontrol edebilirsiniz. Google'da şunları yapabilirsiniz:

  • Doğrudan alıntılar kullanın
  • Siteyi kullan: aramalar
  • inurl:, intitle: veya filetype gibi ek operatörleri kullanma:

Google Arama Konsolu ayrıca, Google'ın kendi taraflarından yinelenen içerik olduğuna inandığını belirlemede çok yararlı olan bir yinelenen içerik raporu ekledi.

– Araçlar: İntihal araçları

Omi gibi, Alexis de farklı intihal araçları kullanır:
Quetext
Noplag
Kağıt Değerlendiricisi
gramer açısından
CopyScape

İçeriğinizin yalnızca orijinal olduğundan değil, aynı zamanda bir botun bakış açısından başka bir kaynaktan alınmış olarak algılanmadığından da emin olmak istersiniz.

Bunlar ayrıca, bir makale içinde, internetteki başka bir yerdeki içeriğe benzer olabilecek segmentleri bulmanıza da yardımcı olabilir.

Alexis, hiçbirimiz robot olmadığımız için "arama motoru botlarına karşı empatik" olmamızı sağlayan bu araçlara sahip olmamızı çok seviyor. Araçlar bize içeriğin çok benzer olduğuna dair sinyaller verdiğinde, bir fark olduğunu bilsek bile, bu, orada kazılacak bir şey olduğuna dair iyi bir işarettir.

– Araçlar: Anahtar kelime yoğunluğu araçları

Alexis'in kullandığı iki anahtar kelime yoğunluğu aracı örneği:
EtiketKalabalık
SEO kitabı

Sitenin türüne bağlı sorunlar

Yinelenen içeriğin çözümlenmesi, gerçekten, yayınladığınız içeriğin türüne ve karşılaştığınız sorunun türüne bağlıdır. Örneğin bloglar, e-ticaret sitelerinde olduğu gibi yinelenen içerik vakalarıyla karşılaşmaz.

unutulmaz vakalar

Alexis, unutulmaz yinelenen içerik sorunları bulduğu son müşteri vakalarını paylaşıyor.

– Çok büyük site: benzersiz içerik eklendikten sonra elde edilen sonuçlar

Bu site çok büyüktü ve tarama bütçesi sorunlarıyla karşılaşıyor. Henüz dizine eklenmemiş 86 milyon sayfası var ve sayfalarının yalnızca %1'i dizine eklendi.

Bu bir emlak sitesi, içeriğin çoğu özellikle benzersiz değil ve sayfalarının çoğu çok, çok benzer. Alexis, sayfaları farklılaştırmak için konuma özel bilgiler eklemek için sayfaya içerik ekledi. Bunun ne kadar çabuk sonuç vermesi şaşırtıcıydı. (Bu yalnızca Google organik verileridir.)

Alexis için bu oldukça genel bir vaka çalışması. Bugün EAT ve benzeri şeylerden ne kadar bahsedersek konuşalım, bu, arama motorlarının içeriği benzersiz ve değerli olarak gördüğü anda bunun hala ödüllendirildiğini gösteriyor.

Bu sitede, yanlışlıkla bir kurallı etiket sorunu, yaklaşık 250 sayfanın yanlış protokole gönderilmesine neden oldu.

Bu, kurallı etiketlerin yanlış ana sayfayı gösterdiği ve HTTPS sayfasının yerine HTTP sayfalarını ittiği bir durumdur.

Son 18 aydaki değişiklikler

Alexis, bu web seminerinden yaklaşık 18 ay önce çok eksiksiz bir makale, Yinelenen içerik ve stratejik çözüm yazdı. SEO hızla değişir ve bilginizi sürekli olarak yenilemeniz ve yeniden değerlendirmeniz gerekir.

Alexis için, rel=next/prev hariç, makalede bahsedilenlerin çoğu bugün hala geçerlidir. Yine de, önümüzdeki beş ila on yıl içinde alakalı olmaktan çıkacağını umuyor.

Geliştiriciler tarafından ele alınan teknik sorunlar: çok manuel

Geliştiriciler tarafından işlenen yinelenen içerikle ilgili sorunların çoğu çok fazla manuel. Alexis, bunların CMS'ler ve Adobe tarafından ele alınması gerektiğine inanıyor. Örneğin, manuel olarak geçmeniz ve tüm kanoniklerin ayarlandığından ve tutarlı olduğundan emin olmanız gerekmez.

– Otomasyon/bildirim fırsatları

Yinelenen içerikle ilgili teknik sorunlar alanında otomasyon için birçok fırsat vardır. Bir örnek vermek gerekirse: HTTPS'ye gitmesi gereken linklerin HTTP'ye gidip gitmediğini hemen tespit edip düzeltebilmeliyiz.

– Site yaşı ve bir engel olarak eski altyapı

Bazı arka uç sistemleri, belirli değişiklikleri ve otomasyonları desteklemek için çok eskidir. Eski bir CMS'yi yenisine taşımak son derece zordur. Omi, Canon'un web sitelerini yeni, özel olarak oluşturulmuş bir CMS'ye taşıma örneğini veriyor. Sadece pahalı değildi, aynı zamanda 12 ay sürdü.

İlgili önceki/sonraki ve Google'dan iletişim

Bazen Google'dan gelen iletişim biraz kafa karıştırıcı olabilir. Omi, Google'ın 2019'da bu etiketlerin yıllardır kullanılmadığını açıklamasına rağmen, müşterisinin rel=prev/next'i uygularken 2018'de performansta önemli bir artış gördüğü bir örnek veriyor.

– Herkese uyan tek tip çözümlerin olmaması

SEO ile ilgili zorluk, bir kişinin kendi web sitesinde gözlemlediklerinin, başka bir SEO'nun kendi web sitesinde gördükleriyle mutlaka aynı olmamasıdır; herkese uyan tek bir SEO yoktur.

Google'ın tüm SEO'larla ilgili duyurular yapabilmesi büyük bir başarı olarak kabul edilmelidir, hatta rel=next/prev örneğinde olduğu gibi bazı açıklamaları eksiktir.

Yinelenen içerik yönetiminin geleceği için umutlar

Alexis'in gelecek için umutları:

  • Daha az teknik tabanlı yinelenen içerik (İYS'ler akıllıca).
  • Daha fazla otomasyon (birim testi ve harici test). Örneğin, OnCrawl gibi araçlar sitenizi düzenli olarak tarayabilir ve belirli hataları fark ettikleri anda sizi bilgilendirebilir.
  • Yazarlar ve içerik yöneticileri için benzerliği yüksek sayfaları ve sayfa türlerini otomatik olarak algılayın. Bu, şu anda Grammarly gibi araçlarda manuel olarak yapılan bazı doğrulamaları otomatik hale getirecektir: Birisi yayınlamaya çalıştığında, CMS "bu biraz benzer—bunu yayınlamak istediğinizden emin misiniz?" Tek web sitelerine bakmanın yanı sıra web siteleri arası karşılaştırmada çok değer var.
  • Google, mevcut sistemlerini ve algılamayı geliştirmeye devam ediyor.
  • Belki de Google'ın doğru kuralı kullanmama sorununu tırmandırmak için bir uyarı sistemi. Google'ı bu konuda uyarmak ve çözmekte fayda var.

Daha iyi araçlara, daha iyi dahili araçlara ihtiyacımız var, ancak umarım Google sistemlerini geliştirirken bize biraz yardımcı olacak öğeler eklerler.

Alexis'in favori teknik numaraları

Alexis'in birkaç favori teknik numarası var:

  • EC2 uzak bilgisayar örneği. Bu, çok büyük taramalar veya çok fazla bilgi işlem gücü gerektiren herhangi bir şey için gerçek bir bilgisayara erişmenin gerçekten harika bir yoludur. Bir kez kurduğunuzda son derece hızlıdır. Paraya mal olduğu için işiniz bittiğinde sonlandırdığınızdan emin olun.
  • Mobil ilk test aracını kontrol edin. Google, bunun baktıklarının en doğru resmi olduğunu belirtti. DOM'a bakar.
  • Kullanıcı aracısını Googlebot'a geçirin. Bu size Googlebot'ların gerçekte ne gördüğü hakkında bir fikir verecektir.
  • TechnicalSEO.com'un robots.txt aracını kullanma. Bu, Merkle'nin araçlarından biridir, ancak Alexis buna gerçekten bayılıyor çünkü robots.txt bazen gerçekten kafa karıştırıcı olabiliyor.
  • Bir günlük analizörü kullanın.
  • Love'ın htaccess denetleyicisi ile yapılmıştır.
  • Değişiklikleri raporlamak için Google Data Studio'yu kullanma (E-Tabloları güncellemelerle senkronize etme, her sayfayı ilgili güncellemelere göre filtreleme).

Teknik SEO zorlukları: robots.txt

Robots.txt gerçekten kafa karıştırıcı.

RegEx'i desteklemesi gerektiği gibi görünen, ancak desteklemeyen eski bir dosya.
İzin vermeme ve izin verme kuralları için farklı öncelik kuralları vardır ve bu da kafa karıştırıcı olabilir.
Farklı botlar, yapmamaları gerektiği halde farklı şeyleri görmezden gelebilirler.

Neyin doğru olduğuna dair varsayımlarınız her zaman doğru olmayabilir.

Soru-Cevap

– HSTS: bölünmüş protokol gerekli mi?

HSTS'niz varsa, yinelenen içerik için tüm HTTPS'ye sahip olmanız gerekir.

– Çevrilmiş içerik yinelenen içerik mi?

Genellikle, hreflang'ı kullandığınızda, ABD ve İrlanda İngilizcesi sayfası gibi aynı dildeki yerelleştirilmiş sürümler arasındaki belirsizliği gidermek için kullanırsınız. Alexis bu yinelenen içeriği dikkate almaz, ancak bunun aynı deneyim olduğunu ve farklı kitleler için optimize edildiğini belirtmek için hreflang etiketlerinizi doğru şekilde ayarladığınızdan emin olmanızı kesinlikle tavsiye eder.

– HTTP/HTTPS geçişi için 301 yönlendirmeleri yerine kurallı etiketler kullanabilir misiniz?

SERP'lerde gerçekte neler olduğunu kontrol etmek faydalı olacaktır. Alexis'in içgüdüsü, bunun iyi olacağını söylemektir, ancak bu, Google'ın gerçekte nasıl davrandığına bağlıdır. İdeal olarak, bunlar tamamen aynı sayfaysa, bir 301 kullanmak istersiniz, ancak geçmişte bu tür geçiş için kurallı etiketlerin işe yaradığını görmüştür. Hatta bunun kazara gerçekleştiğini bile gördü.

Omi'nin deneyimine göre, sorunları önlemek için 301'leri kullanmanızı şiddetle tavsiye ediyor: Web sitesini taşıyorsanız, mevcut ve gelecekteki hataları önlemek için doğru şekilde taşıyabilirsiniz.

– Yinelenen sayfa başlıklarının etkisi

Diyelim ki farklı konumlar için çok benzer bir başlığınız var, ancak içerik çok farklı. Alexis için bu yinelenen içerik olmasa da, arama motorlarının bunu "genel" türden bir şey olarak ele aldığını düşünüyor ve başlıklar, olası sorunları olan alanları belirlemek için kullanılabilecek bir şey.

Burası bir [site: + intitle: ] araması kullanmak isteyebileceğiniz yer.

Ancak, aynı başlık etiketine sahip olmanız, yinelenen içerik sorununa neden olmaz.

Sayfalandırılmış veya diğer çok benzer sayfalarda bile benzersiz başlıklar ve meta açıklamalar hedeflemelisiniz. Bunun nedeni yinelenen içerik değil, sayfalarınızı SERP'lerde nasıl sunduğunuzu optimize etme isteğinizle ilgilidir.

Üst uç

"Yinelenen içerik hem teknik hem de içerik pazarlaması için bir zorluktur."

Orbit'te SEO uzaya gitti

27 Haziran'daki uzay yolculuğumuzu kaçırdıysanız, buradan yakalayın ve uzaya gönderdiğimiz tüm ipuçlarını keşfedin.