XML Site Haritası: optimizasyon için temel öneriler
Yayınlanan: 2021-03-26Sitenizdeki Sitemap.xml, Google botunun dizine eklemesini istediğiniz sayfalar için iyi bir gezinme işlevi görebilir. İyi bir dahili bağlantınız olmasa bile ana sayfalarınızı daha hızlı bulmanıza yardımcı olur.
Bu yazıda, XML Site Haritasının optimizasyonu ve bunu yapmanın neden iyi olduğu için çeşitli öneriler sunacağız.
İşlevler ve avantajlar
Botların çalışmasını kolaylaştırın ve sitenizde kolayca bulunamayan sayfalar ve bağlantılar için "raporlar" alma olanağına izin verin.
SEO avantajlarından bazıları şunlardır:
- daha hızlı indeksleme – arama motorları yeni sayfaları çok daha hızlı bulacaktır, bu nedenle web sitesini arama sonuçlarında indeksleme ve görüntüleme süreci daha hızlı olacaktır. Buradaki tuhaf şey, aynı zamanda indeksten arındırma konusunda da size yardımcı olabilmesidir (buradan daha fazla bilgi edinebilirsiniz);
- dahili sayfaların daha iyi dizine eklenmesi – arama motorları, web sitesini tararken bulunmayan sayfaları bulabilir. Ancak bu, hepsinin dizine ekleneceği anlamına gelmez.
- indekslenmiş sayfaların izlenmesi. Google Arama Konsolu ile birlikte, Google'ın dizine eklediği XML Site Haritasında hangi URL'lerin kapsandığını öğrenebilirsiniz.
XML Site Haritası önemli mi?
Şu siteler için önemlidir:
- iyi bir yapıya sahip değiller veya iyi bir iç bağlantı dağılımına sahip değiller;
- çok sayfa var – XML site haritası, arama motorlarının yeni veya güncellenmiş sayfaları bulmasına yardımcı olur;
- çok fazla gelen bağlantınız yok – bu, sayfalarınızı bulmanın harika bir yolu olacaktır.
Gereksinimler ve biçimler
Google, birkaç Site Haritası biçimini destekler. Tüm formatlar ve standartlar şu adreste bulunabilir: https://www.sitemaps.org/index.html.
Tüm biçimler, site haritasını 50 MB (sıkıştırılmamış) ve 50.000 adresle sınırlar. Daha büyük bir dosyanız veya daha fazla adresiniz varsa, tüm haritaları içeren bir dizin dosyası oluşturmanız gerekecektir (aşağıdaki makalede açıklanmıştır).
Başlıca öneriler şunlardır:
- dosya UTF-8 ile kodlanmalıdır;
- açık bir etiketle başlamalı ve … gibi bir yakın etiketle bitmelidir. ;
- etikette standart protokolü belirtin;
- her URL girişi için ana etiket;
- Kaydetmek için ana etikete katılması gereken, etikette protokolle (https veya http) başlayan URL'yi belirtin.
XML site haritaları için isteğe bağlı ek özellikler
Google, bu özelliği sitelerinde kullanmaz. Diğer tüm nitelikler mevcuttur, ancak bunların yansıtılıp yansıtılmayacağına bağlıdır. Bu nedenle, Google'ın bu etiketleri çok ciddiye almadığını unutmayın. Bunlar:
- – son dosya değişikliğinin tarihini temsil eder. W3C Datetime biçiminde olmalıdır;
- – sayfanın ne sıklıkla güncelleneceği. Bu değer, arama motorları hakkında genel bilgi sağlar. Geçerli değerler her zaman, saatlik, günlük, haftalık, aylık, yıllık, hiçbir zaman olabilir.
Unutulmamalıdır ki bu etiketin değeri bir komuttan çok bir ipucu olarak değerlendirilir. Robotlar bu bilgiyi görür ve dikkate alır, ancak diğer birçok faktöre bağlı olarak nihayetinde onu kullanıp kullanmamaya kendileri karar verir.
- – Sitenizdeki diğer URL'lere göre URL'ye öncelik verir. Geçerli değerler 0.0 arasında değişir. 1.0'a.
Burada yine bu önceliğin göreceli olduğu ve robotlar için zorunlu bir koşul olmadığı ya da en azından henüz öyle kabul edilmediği unutulmamalıdır. Ancak, denemeye karar verirseniz, aşağıdaki kılavuzu kullanın:
- 0 – 0.3: Eski haberler, artık geçerli olmayan ancak tarihsel olarak faydalı bilgiler;
- 4 – 0.7: Blog makaleleri, sayfa kategorileri, sık sorulan sorular;
- 8 – 1.0: Ana sayfa, ürün sayfaları, iyi optimize edilmiş içeriğe sahip tüm sayfalar.
Aşağıdaki örnek, yalnızca bir URL içeren ve italik olarak yazılmış tüm isteğe bağlı etiketleri kullanan bir Site Haritasını göstermektedir.
https://netpeak.bg
2018-09-15
aylık
0,8
Önemli sayfaları belirleme
Yüksek kaliteli sayfalar ve iyi optimize edilmiş sayfalar ekleyin. Genel kalite, daha iyi sıralama için büyük önem taşımaktadır. Bu, Google için size rekabette ciddi bir öncelik verebilecek ciddi bir faktördür.
Düşük kaliteli sayfaları ziyaret etmek istemiyoruz, Google botları da istemiyor. Kullanıcılar için yararlı olmayan ve iyi optimize edilmemiş binlerce sayfaya yönlendirirseniz, bu sadece size zarar verebilir. Yüksek kaliteli sayfalar nelerdir? Basitçe söylemek gerekirse, bunlar şu sayfalardır:
- yeterli benzersiz içeriğe sahip olmak;
- harekete geçerek (yorumlar, incelemeler vb.) kullanıcıları ile hızlı bir şekilde etkileşime geçme;
- resimleri, videoları vb. dahil edin;
- Google politikalarını ihlal etmeyin;
İndeksleme için açılan sayfalar
Tarama bütçesi genellikle zaman birimi (gün, hafta, ay, vb.) başına taranan sayfa sayısını temsil eder. Bu nedenle gereksiz yere israf edilmesi önerilmez.
“Noindex” meta etiketini içeren sayfalar site haritasına eklenmemelidir. mantıklı bir sıra takip etmek her şey için önemlidir.
Otomatik kontrol yapılması ve indekslemeye kapatılan adreslerin dahil edilmemesi gerekmektedir.
Bu talimatları izlemeniz önerilir:
- https://example.com/category/product sayfasında “noindex” meta etiketi varsa, sitenin XML haritasına dahil edilmemelidir;
- Sayfa robots.txt yoluyla indekslenmek üzere kapatıldığında, XML haritasına dahil edilmemelidir:
İzin verme: /category/product
Noindex: /kategori/ürün
- Sayfa, HTTP başlığında X-Robots-Tag aracılığıyla indekslenmeye kapatılmışsa, sitenin XML haritasına da dahil edilmemelidir:
HTTP/1.1 200 TAMAM
Tarih: 25 Mayıs 2010 Salı 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)
Sayfaların kanonik versiyonları
Benzer içeriğe sahip birden fazla URL aracılığıyla tek bir sayfaya erişim, Google tarafından kopyalanmış olarak kabul edilecektir.
“Ana” sayfa olan ve taranması ve dizine eklenmesi gereken bota talimat vermek için “link rel canonical” özniteliğini kullanmalısınız.
Örneğin, https://example.com/category/product-1 sayfasının https://example.com/product için standart değeri varsa, http://example.com/category/product-1 bu sayfaya katılmamalıdır. XML site haritası.
Otomatik bir kontrol yapmalısınız, çünkü süreçlerin otomasyonu kesinlikle size daha az baş ağrısı getirecek ve manuel incelemeler için size zaman kazandıracaktır.
200 OK döndüren sayfalar
200 OK yanıtı döndüren adresleri dahil edin. Otomatik kontroller yapmak ve 200 OK dışında bir yanıt döndüren adresleri dahil etmemek önemlidir – örneğin 404, 301, vb.
Örneğin, https://example.com/product sayfası 200 OK'den farklı bir yanıt veriyorsa site haritasına katılmamalıdır.
Kontrol etmek için aşağıdaki aracı kullanabilirsiniz: https://soft.galinov.com/ kontrol etmek için.
Sayfalandırmadan sayfalar
Sitemap.xml'de tüm sayfaları kesinlikle dahil etmek gerekli değildir. Bot, doğru tanımlanmışsa ilgili kategorideki ilk sayfadan gezinebilecek kadar akıllıdır. Aşağıdakileri yapmanız önerilir:
- kategorilerin sadece ana sayfalarını içerir;
- robotun aralarındaki bağlantıyı görebilmesi için sayfaları rel = next / rel = prev ile işaretleyin;
- sayfalandırmanın her sayfası, ana sayfaya değil, kendisine kurallı yönlendirmeye sahip olmalıdır, çünkü tersi olursa, bota “5.000 ürünüm ve 20 sayfam olması önemli değil, onlar ilkiyle aynı."
Örneğin, https://example.com/category/page-2 sayfası haritaya katılmamalıdır. Burada Google'ın resmi görüşünü ve önerilerini bulabilirsiniz:
Dosya boyutunu küçült
Google ve Bing, 2016'da dosya boyutlarını 10 MB'den 50 MB'a çıkardı, ancak Site Haritanızı olabildiğince küçük tutmak yine de iyi bir uygulamadır.
Tabii ki endişelenecek bir şey değil, ancak site haritanız 50.000'den fazla URL içeriyorsa veya boyutu 50 MB'ı aşarsa, daha fazla XML haritasına bölünmelidir. Bu durumda, tüm XML haritalarına yapılan referanslar ayrı bir site haritası dizin dosyasında açıklanmalıdır.
XML Site Haritası Dizin Dosyası Nedir?
Birden fazla Site Haritası dosyası gönderebilirsiniz, ancak her dosyanın yukarıdaki kurallara uyması gerekir. İsterseniz, gereksinimlerinize göre boyutlarını küçültmek için gzip kullanarak dosyaları sıkıştırabilirsiniz.
Dizin dosyasının XML biçimi, normal site haritası biçimine çok benzer. Şunları içermelidir:
- etiketi aç ve kapat ;
- ana XML özniteliği olan her Site Haritası için bir giriş;
- ana özniteliğe etiketleyin.
Önerilen öznitelik de dahildir.
Not: Site Haritası dizin dosyası yalnızca aynı sitede bulunan haritaları listeleyebilir. Örneğin:
https://example.com/sitemap_index.xml, https://example.com adresindeki haritaları içerebilir, ancak https://www.saitprimer.com veya https://www.example.com'da bulunmaz
Diğer tüm dosyalarda olduğu gibi, dizin dosyası UTF-8 ile kodlanmalıdır.
Aşağıdaki örnek, iki haritayı listeleyen bir Site Haritası dizini gösterir:
http://www.example.com/sitemap1.xml.gz
2018-10-01T18:23:17+00:00
http://www.example.com/sitemap2.xml.gz
2017-01-01
Mobil sürümün açıklaması
Google botunun içeriğimizi bulmasına ve masaüstü ile mobil sayfalar arasındaki bağlantıyı anlamasına yardımcı olmamız gerekiyor. XML site haritasına, masaüstü sürüm sayfaları için rel = “alternate” özniteliği aşağıdaki gibi eklenmelidir:
xmlns:xhtml=”http://www.w3.org/1999/xhtml”>
http://www.example.com/page-1/
<xhtml:bağlantı
rel=”alternatif”
media=”yalnızca ekran ve (maksimum genişlik: 640 piksel)”
href=”http://m.example.com/page-1″ />
Her masaüstü sayfasının mobil sürümün bir sayfasına karşılık gelmesi gerektiğini unutmayın. Örneğin, birkaç masaüstü sayfasının rel = “alternate” aracılığıyla mobil sürümün bir sayfasına bağlanması ve bunun tersi tavsiye edilmez.
Yönlendirmeleri de kontrol etmelisiniz. Masaüstü sayfasının mobil sürümdeki aynı içeriğe karşılık gelmesi ve bir başkasına yönlendirme yapmaması önemlidir. Ek bilgi burada.
Botlar XML Site Haritanızı nasıl bulabilir?
Sürecin tüm otomasyonunu bitirip sunucunuza yüklediğinizde (veya bir eklenti tarafından oluşturulduğunda), botların bulabileceği bir ipucu bırakmanız gerekir.
En iyi yol, robots.txt dosyanıza bir bağlantı eklemektir. Buna Site Haritası Keşfi de denir ve bu, Google, Bing ve Yahoo'nun robotlarının XML Site Haritalarını bulmasına yardımcı olmak için 2007'de tanıttığı bir şeydir.
Tek yapmanız gereken haritanızın veya dizin dosyanızın tam yolunu eklemek.
Adreslerin doğru harf çevirisi
Resmi Google belgeleri (Bir Site Haritası oluşturun ve gönderin), tüm veri değerlerinin (URL'ler dahil) yalnızca ASCII karakterlerini içermesi gerektiğini vurgular. Kontrol kodları veya * veya {} gibi özel karakterler içeremez.
Sitenizin URL'si bu karakterleri içeriyorsa, eklemeye çalıştığınızda bir hata alırsınız.
Haritanızı Google'a gönderin
Site haritanızı Google Arama Konsolu üzerinden Google'a gönderebilirsiniz.
Göndermeden önce herhangi bir hata olup olmadığını kontrol edin. Önemli açılış sayfalarının dizine eklenmesine engel olabilecek hataları temizlemek önemlidir.
İdeal olarak, dizine eklenen sayfaların sayısı gönderilen sayfaların sayısına eşit olmalıdır.
Çözüm
- Tutarlı olun – sayfa robots.txt veya “noindex” tarafından engelleniyorsa, XML haritanızda olmaması daha iyidir.
- Sürecinizi otomatikleştirin – yukarıdaki önerilerin tümü otomasyon için mevcut olmalıdır, çünkü bu size zaman kazandırır, Tarama bütçesinin optimize edilmesine yardımcı olur ve ayrıca sizi birçok baş ağrısından kurtarır.
- Çok büyük bir siteniz varsa, size sunucu süresi kazandıracak ve sitenizdeki tüm önemli sayfaları kapsayacak farklı haritalara sahip bir dizin dosyası kullanın.