Peta Situs XML: rekomendasi utama untuk pengoptimalan
Diterbitkan: 2021-03-26Sitemap.xml di situs Anda dapat berfungsi sebagai navigasi yang baik untuk halaman yang Anda inginkan untuk diindeks oleh bot Google. Ini membantu Anda menemukan halaman utama Anda lebih cepat, bahkan jika Anda tidak memiliki tautan internal yang baik.
Pada artikel ini, kami akan menyajikan berbagai rekomendasi untuk optimasi XML Sitemap dan mengapa hal ini baik untuk dilakukan.
Fungsi dan keunggulan
Mempermudah bot untuk bekerja dan memungkinkan kemungkinan untuk mendapatkan "laporan" untuk halaman dan tautan di situs Anda yang tidak dapat ditemukan dengan mudah.
Beberapa manfaat SEO adalah sebagai berikut:
- pengindeksan lebih cepat – mesin pencari akan menemukan halaman baru lebih cepat, sehingga proses pengindeksan dan menampilkan situs web dalam hasil pencarian akan lebih cepat. Hal yang aneh di sini adalah ia juga dapat membantu Anda dengan deindexing (informasi lebih lanjut di sini);
- pengindeksan halaman internal yang lebih baik – mesin pencari dapat menemukan halaman yang tidak ditemukan saat merayapi situs web. Tetapi ini tidak berarti bahwa mereka semua akan diindeks.
- pemantauan halaman yang diindeks. Dalam kombinasi dengan Google Search Console, Anda dapat mengetahui URL mana yang tercakup dalam Peta Situs XML yang diindeks oleh Google.
Apakah Peta Situs XML penting?
Penting untuk situs yang:
- tidak memiliki struktur yang baik atau tidak memiliki distribusi internal link yang baik;
- memiliki banyak halaman – XML sitemap membantu mesin pencari menemukan halaman yang baru atau diperbarui;
- tidak memiliki banyak tautan masuk – ini akan menjadi cara yang bagus untuk menemukan halaman Anda.
Persyaratan dan format
Google mendukung beberapa format Peta Situs. Semua format dan standar dapat ditemukan di alamat ini: https://www.sitemaps.org/index.html.
Semua format membatasi peta situs hingga 50MB (tidak terkompresi) dan 50.000 alamat. Jika Anda memiliki file yang lebih besar atau lebih banyak alamat, Anda perlu membuat file indeks dengan semua peta (dijelaskan dalam artikel di bawah).
Rekomendasi utamanya adalah:
- file harus dikodekan dengan UTF-8;
- harus dimulai dengan tag terbuka dan diakhiri dengan tag penutup seperti …. ;
- tentukan protokol standar dalam tag;
- tag utama untuk setiap entri URL;
- tentukan URL yang dimulai dengan protokol (https atau http) dalam tag, yang harus berpartisipasi dalam tag utama untuk disimpan.
Atribut opsional tambahan untuk peta situs XML
Google tidak menggunakan atribut di situsnya. Semua atribut lain tersedia, tetapi itu tergantung pada apakah atribut tersebut akan direfleksikan. Oleh karena itu, perlu diingat bahwa Google tidak menganggap serius tag ini. Mereka:
- – mewakili tanggal perubahan file terakhir. Harus dalam format W3C Datetime;
- – seberapa sering halaman tersebut kemungkinan akan diperbarui. Nilai ini memberikan informasi umum tentang mesin pencari. Nilai yang valid bisa selalu, per jam, harian, mingguan, bulanan, tahunan, tidak pernah.
Perlu diingat bahwa nilai tag ini lebih dianggap sebagai petunjuk daripada perintah. Robot melihat informasi ini dan memperhitungkannya, tetapi akhirnya memutuskan sendiri apakah akan menggunakannya, tergantung pada banyak faktor lainnya.
- – Memprioritaskan URL di atas URL lain di situs Anda. Nilai yang valid berkisar dari 0,0. ke 1.0.
Di sini sekali lagi, perlu diingat bahwa prioritas ini bersifat relatif dan bukan merupakan syarat wajib bagi robot, atau setidaknya belum diterima demikian. Namun, jika Anda memutuskan untuk mencobanya, gunakan panduan berikut:
- 0 – 0,3: Berita usang, informasi yang tidak lagi valid, tetapi bermanfaat secara historis;
- 4 – 0,7: Artikel blog, kategori halaman, pertanyaan umum;
- 8 – 1.0: Halaman beranda, halaman produk, semua halaman dengan konten yang dioptimalkan dengan baik.
Contoh berikut menunjukkan Peta Situs yang hanya berisi satu URL dan menggunakan semua tag opsional yang ditulis dalam huruf miring .
https://netpeak.bg
2018-09-15
bulanan
0.8
Mengidentifikasi halaman-halaman penting
Tambahkan halaman berkualitas tinggi dan halaman yang dioptimalkan dengan baik. Kualitas keseluruhan sangat penting untuk peringkat yang lebih baik. Ini adalah faktor serius bagi Google yang dapat memberi Anda prioritas serius dalam persaingan.
Kami tidak ingin mengunjungi halaman berkualitas rendah, begitu pula bot Google. Jika Anda mengarahkannya ke ribuan halaman yang tidak berguna bagi pengguna dan tidak dioptimalkan dengan baik, ini hanya dapat merugikan Anda. Apa itu halaman berkualitas tinggi? Sederhananya, itu adalah halaman yang:
- memiliki konten unik yang cukup;
- libatkan pengguna mereka dengan cepat dengan mendorong tindakan (komentar, ulasan, dll.);
- termasuk gambar, video, dll.;
- jangan melanggar kebijakan Google;
Halaman terbuka untuk pengindeksan
Anggaran perayapan umumnya menunjukkan jumlah halaman yang dirayapi per unit waktu (hari, minggu, bulan, dll.). Oleh karena itu, tidak disarankan untuk menyia-nyiakannya secara tidak perlu.
Halaman yang berisi tag meta “Noindex” tidak boleh ditambahkan ke peta situs. untuk mengikuti urutan logis itu penting untuk semuanya.
Hal ini diperlukan untuk melakukan pemeriksaan otomatis dan tidak menyertakan alamat yang ditutup untuk pengindeksan.
Disarankan untuk mengikuti petunjuk ini:
- Jika halaman https://example.com/category/product memiliki tag meta “noindex”, itu tidak boleh disertakan dalam peta XML situs;
- Saat halaman ditutup untuk pengindeksan melalui robots.txt, halaman tersebut tidak boleh disertakan dalam peta XML:
Larang: /kategori/produk
Noindex: /kategori/produk
- Jika halaman ditutup untuk pengindeksan melalui X-Robots-Tag di header HTTP, halaman tersebut juga tidak boleh disertakan dalam peta XML situs:
HTTP/1.1 200 Oke
Tanggal: Sel, 25 Mei 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)
Versi kanonik halaman
Akses ke satu halaman melalui beberapa URL dengan konten serupa akan dianggap diduplikasi oleh Google.
Anda harus menggunakan atribut "link rel canonical" untuk menginstruksikan bot yang merupakan halaman "utama" dan yang harus dirayapi dan diindeks.
Misalnya, jika laman https://example.com/category/product-1 memiliki kanonis untuk https://example.com/product, maka http://example.com/category/product-1 tidak boleh berpartisipasi dalam peta situs XML.
Anda harus melakukan pemeriksaan otomatis karena otomatisasi proses pasti akan mengurangi sakit kepala Anda dan menghemat waktu Anda untuk inspeksi manual.
Halaman yang mengembalikan 200 OK
Sertakan alamat yang mengembalikan respons 200 OK. Penting untuk melakukan pemeriksaan otomatis dan tidak menyertakan alamat yang mengembalikan respons selain 200 OK – misalnya 404, 301, dll.
Misalnya, jika laman https://example.com/product mengembalikan respons yang berbeda dari 200 OK, maka laman tersebut tidak boleh berpartisipasi dalam peta situs.
Anda dapat menggunakan alat berikut untuk memeriksa: https://soft.galinov.com/ untuk memeriksa.
Halaman dari pagination
Anda tidak perlu menyertakan semua halaman di sitemap.xml. Bot cukup pintar untuk dapat menavigasi dari halaman pertama dalam kategori yang relevan jika dijelaskan dengan benar. Disarankan untuk melakukan hal berikut:
- sertakan hanya halaman utama kategori;
- tandai halaman dengan rel = next / rel = prev sehingga robot dapat melihat hubungan di antara mereka;
- setiap halaman pagination harus memiliki panduan kanonik untuk dirinya sendiri, bukan ke halaman utama, karena jika sebaliknya, itu berarti Anda memberi tahu bot “Tidak masalah saya memiliki 5.000 produk dan 20 halaman, mereka sama dengan yang pertama.”
Misalnya, laman https://example.com/category/page-2 tidak boleh berpartisipasi dalam peta. Di sini Anda dapat menemukan pendapat resmi Google, serta rekomendasi mereka:
Minimalkan ukuran file
Google dan Bing meningkatkan ukuran file dari 10MB menjadi 50MB pada tahun 2016, namun tetap merupakan praktik yang baik untuk menjaga Peta Situs Anda sekecil mungkin.
Tentu saja, ini bukan sesuatu yang perlu dikhawatirkan, tetapi jika peta situs Anda berisi lebih dari 50.000 URL atau berukuran melebihi 50MB, peta situs harus dipecah menjadi lebih banyak peta XML. Dalam hal ini, referensi ke semua peta XML harus dijelaskan dalam file indeks peta situs terpisah.
Apa itu File Indeks Peta Situs XML
Anda dapat mengirimkan beberapa file Peta Situs, tetapi setiap file harus mematuhi aturan di atas. Jika mau, Anda dapat mengompres file menggunakan gzip untuk memperkecil ukurannya sesuai kebutuhan.
Format XML file indeks sangat mirip dengan format peta situs biasa. Itu harus berisi:
- buka dan tutup tag sebagai ;
- entri untuk setiap Peta Situs dengan atribut XML utama adalah ;
- tag ke atribut utama.
Atribut yang direkomendasikan juga disertakan.
Catatan: File indeks peta situs hanya dapat mencantumkan peta yang ada di situs yang sama. Sebagai contoh:
https://example.com/sitemap_index.xml dapat menyertakan peta di https://example.com, tetapi tidak di https://www.saitprimer.com atau https://www.example.com
Seperti semua file lainnya, file indeks harus dikodekan dengan UTF-8.
Contoh berikut menunjukkan indeks Peta Situs yang mencantumkan dua peta:
http://www.example.com/sitemap1.xml.gz
01-10-2018T18:23:17+00:00
http://www.example.com/sitemap2.xml.gz
2017-01-01
Deskripsi versi seluler
Kami perlu membantu bot Google untuk menemukan konten kami dan memahami hubungan antara halaman desktop dan seluler. Dalam XML sitemap harus ditambahkan atribut rel = “alternate” untuk halaman versi desktop, sebagai berikut:
xmlns:xhtml="http://www.w3.org/1999/xhtml">
http://www.example.com/page-1/
<xhtml:tautan
rel=”alternatif”
media="hanya layar dan (lebar maks: 640px)"
href="http://m.example.com/page-1″ />
Ingatlah bahwa setiap halaman desktop harus sesuai dengan satu halaman versi seluler. Tidak disarankan, misalnya, beberapa halaman desktop ditautkan melalui rel = “alternate” ke satu halaman versi seluler dan sebaliknya.
Anda juga harus memeriksa pengalihan. Penting bahwa halaman desktop sesuai dengan konten yang sama di versi seluler, dan tidak dialihkan ke yang lain. Informasi tambahan di sini.
Bagaimana bot dapat menemukan Peta Situs XML Anda
Ketika Anda telah menyelesaikan semua otomatisasi proses dan mengunggahnya ke server Anda (atau membuatnya dengan plugin), Anda harus meninggalkan petunjuk di mana bot dapat menemukannya.
Cara terbaik adalah dengan menyertakan link ke file robots.txt Anda. Ini juga disebut Penemuan Peta Situs dan itu adalah sesuatu yang diperkenalkan oleh Google, Bing, dan Yahoo pada tahun 2007 untuk membantu robot mereka menemukan Peta Situs XML.
Yang harus Anda lakukan adalah memasukkan path lengkap ke peta atau file indeks Anda.
Transliterasi alamat yang benar
Dokumentasi resmi Google (Build and submit a Sitemap) menekankan bahwa semua nilai data (termasuk URL) hanya boleh berisi karakter ASCII. Itu tidak bisa berisi kode kontrol atau karakter khusus seperti * atau {}.
Jika URL situs Anda berisi karakter ini, Anda akan mendapatkan kesalahan saat mencoba menambahkannya.
Kirim peta Anda ke Google
Anda dapat mengirimkan peta situs Anda ke Google melalui Google Search Console.
Periksa kesalahan apa pun sebelum mengirimkan. Sangat penting untuk menjernihkan kesalahan yang mungkin menjadi penghalang untuk mengindeks halaman arahan utama.
Idealnya, jumlah halaman yang diindeks harus sama dengan jumlah halaman yang dikirimkan.
Kesimpulan
- Konsisten – jika halaman diblokir oleh robots.txt atau “noindex”, lebih baik tidak ada di peta XML Anda.
- Otomatiskan proses Anda – semua rekomendasi di atas harus tersedia untuk otomatisasi, karena ini akan menghemat waktu Anda, membantu anggaran Perayapan agar tetap optimal, dan juga menghemat banyak sakit kepala.
- Jika Anda memiliki situs yang sangat besar, gunakan file indeks dengan peta berbeda yang akan menghemat waktu server Anda dan akan mencakup semua halaman penting di situs Anda.