XML Sitemap: คำแนะนำที่สำคัญสำหรับการเพิ่มประสิทธิภาพ
เผยแพร่แล้ว: 2021-03-26Sitemap.xml บนไซต์ของคุณสามารถทำหน้าที่เป็นการนำทางที่ดีสำหรับหน้าที่คุณต้องการให้ Google bot จัดทำดัชนี ช่วยให้คุณค้นหาหน้าหลักได้เร็วขึ้น แม้ว่าคุณจะไม่มีการเชื่อมโยงภายในที่ดี
ในบทความนี้ เราจะนำเสนอคำแนะนำต่างๆ สำหรับการเพิ่มประสิทธิภาพ XML Sitemap และเหตุใดจึงควรทำเช่นนี้
ฟังก์ชันและข้อดี
ทำให้บอททำงานได้ง่ายขึ้นและอนุญาตให้รับ "รายงาน" สำหรับหน้าและลิงก์ในไซต์ของคุณที่หาได้ยาก
ประโยชน์บางประการของ SEO มีดังนี้:
- การจัดทำดัชนีเร็วขึ้น – เครื่องมือค้นหาจะพบหน้าใหม่ได้เร็วกว่ามาก ดังนั้นกระบวนการสร้างดัชนีและการแสดงเว็บไซต์ในผลการค้นหาจะเร็วขึ้น สิ่งแปลก ๆ ที่นี่คือมันสามารถช่วยคุณในการ deindexing (ข้อมูลเพิ่มเติมที่นี่);
- การจัดทำดัชนีหน้าภายในที่ดีขึ้น – เครื่องมือค้นหาสามารถค้นหาหน้าที่ไม่พบเมื่อรวบรวมข้อมูลเว็บไซต์ แต่นี่ไม่ได้หมายความว่าพวกเขาทั้งหมดจะถูกจัดทำดัชนีเสมอไป
- การตรวจสอบหน้าที่จัดทำดัชนี เมื่อใช้ร่วมกับ Google Search Console คุณจะพบว่า URL ใดบ้างที่ครอบคลุมใน XML Sitemap ที่ Google จัดทำดัชนี
XML Sitemap มีความสำคัญหรือไม่
เป็นสิ่งสำคัญสำหรับไซต์ที่:
- ไม่มีโครงสร้างที่ดีหรือไม่มีการเชื่อมโยงภายในที่ดี
- มีหลายหน้า – แผนผังเว็บไซต์ XML ช่วยให้เครื่องมือค้นหาค้นหาหน้าที่ใหม่หรืออัปเดต
- ไม่มีลิงก์ขาเข้าจำนวนมาก – นี่จะเป็นวิธีที่ดีในการค้นหาหน้าเว็บของคุณ
ข้อกำหนดและรูปแบบ
Google รองรับรูปแบบแผนผังเว็บไซต์หลายรูปแบบ สามารถดูรูปแบบและมาตรฐานทั้งหมดได้ตามที่อยู่นี้: https://www.sitemaps.org/index.html
รูปแบบทั้งหมดจำกัดแผนผังเว็บไซต์ไว้ที่ 50MB (ไม่บีบอัด) และที่อยู่ 50,000 รายการ หากคุณมีไฟล์ขนาดใหญ่หรือมีที่อยู่มากกว่านี้ คุณจะต้องสร้างไฟล์ดัชนีพร้อมแผนที่ทั้งหมด (อธิบายไว้ในบทความด้านล่าง)
คำแนะนำหลักคือ:
- ไฟล์ต้องเข้ารหัสด้วย UTF-8
- ต้องขึ้นต้นด้วยแท็กเปิดและปิดท้ายด้วยแท็กปิดเช่น…. ;
- ระบุโปรโตคอลมาตรฐานในแท็ก
- แท็กหลักสำหรับรายการ URL แต่ละรายการ ;
- ระบุ URL ที่ขึ้นต้นด้วยโปรโตคอล (https หรือ http) ในแท็ก ซึ่งต้องเข้าร่วมในแท็กหลักเพื่อบันทึก
แอตทริบิวต์เสริมเพิ่มเติมสำหรับแผนผังเว็บไซต์ XML
Google ไม่ได้ใช้แอตทริบิวต์นี้ในเว็บไซต์ของตน คุณลักษณะอื่นๆ ทั้งหมดมีให้ใช้งาน แต่ขึ้นอยู่กับว่าจะสะท้อนให้เห็นหรือไม่ ดังนั้น โปรดทราบว่า Google ไม่ได้ให้ความสำคัญกับแท็กเหล่านี้มากนัก พวกเขาคือ:
- – แสดงถึงวันที่ของการเปลี่ยนแปลงไฟล์ครั้งล่าสุด ต้องอยู่ในรูปแบบ W3C Datetime;
- – หน้ามีแนวโน้มที่จะอัพเดทบ่อยแค่ไหน ค่านี้ให้ข้อมูลทั่วไปเกี่ยวกับเครื่องมือค้นหา ค่าที่ถูกต้องสามารถเป็นได้เสมอ รายชั่วโมง รายวัน รายสัปดาห์ รายเดือน รายปี ไม่เคยเลย
โปรดทราบว่าค่าของแท็กนี้ถือเป็นคำใบ้มากกว่าคำสั่ง หุ่นยนต์เห็นข้อมูลนี้และนำมาพิจารณา แต่ท้ายที่สุดแล้วตัดสินใจด้วยตัวเองว่าจะใช้ข้อมูลนี้หรือไม่ ทั้งนี้ขึ้นอยู่กับปัจจัยอื่นๆ อีกมาก
- – จัดลำดับความสำคัญของ URL มากกว่า URL อื่น ๆ ในเว็บไซต์ของคุณ ค่าที่ถูกต้องมีตั้งแต่ 0.0 ถึง 1.0
ขอย้ำอีกครั้งว่าลำดับความสำคัญนี้สัมพันธ์กันและไม่ใช่เงื่อนไขบังคับสำหรับโรบ็อต หรืออย่างน้อยก็ยังไม่เป็นที่ยอมรับ อย่างไรก็ตาม หากคุณตัดสินใจที่จะลองใช้งาน ให้ใช้คำแนะนำต่อไปนี้:
- 0 – 0.3: ข่าวล้าสมัย ข้อมูลที่ใช้ไม่ได้อีกต่อไป แต่มีประโยชน์ในอดีต
- 4 – 0.7: บทความบล็อก, หมวดหมู่หน้า, คำถามที่พบบ่อย;
- 8 – 1.0: หน้าแรก หน้าผลิตภัณฑ์ ทุกหน้าที่มีเนื้อหาที่ปรับให้เหมาะสมที่สุด
ตัวอย่างต่อไปนี้แสดงแผนผังเว็บไซต์ที่มี URL เพียงรายการเดียวและใช้แท็กที่เป็นตัวเลือกทั้งหมดที่เขียนด้วย ตัวเอียง
https://netpeak.bg
2018-09-15
รายเดือน
0.8
การระบุหน้าที่สำคัญ
เพิ่มหน้าคุณภาพสูงและหน้าที่ได้รับการปรับให้เหมาะสม คุณภาพโดยรวมมีความสำคัญอย่างยิ่งสำหรับการจัดอันดับที่ดีขึ้น นี่เป็นปัจจัยสำคัญสำหรับ Google ที่สามารถให้ความสำคัญกับการแข่งขันได้
เราไม่ต้องการเข้าชมหน้าคุณภาพต่ำ บอทของ Google ก็เช่นกัน หากคุณนำไปยังหน้าหลายพันหน้าที่ไม่เป็นประโยชน์ต่อผู้ใช้และไม่ได้รับการปรับให้เหมาะสม การทำเช่นนี้อาจเป็นอันตรายสำหรับคุณเท่านั้น เพจคุณภาพสูงคืออะไร? พูดง่ายๆ คือ หน้าที่:
- มีเนื้อหาเฉพาะเพียงพอ
- ดึงดูดผู้ใช้อย่างรวดเร็วด้วยการกระตุ้นให้ดำเนินการ (ความคิดเห็น บทวิจารณ์ ฯลฯ)
- รวมรูปภาพ วิดีโอ ฯลฯ .;
- ไม่ละเมิดนโยบายของ Google
หน้าที่เปิดสำหรับการจัดทำดัชนี
โดยทั่วไป งบประมาณการรวบรวมข้อมูลจะแสดงจำนวนหน้าที่รวบรวมข้อมูลต่อหน่วยเวลา (วัน สัปดาห์ เดือน ฯลฯ) ดังนั้นจึงไม่แนะนำให้เสียโดยไม่จำเป็น
ไม่ควรเพิ่มหน้าที่มีเมตาแท็ก "Noindex" ลงในแผนผังไซต์ การทำตามลำดับตรรกะเป็นสิ่งสำคัญสำหรับทุกสิ่ง
จำเป็นต้องทำการตรวจสอบอัตโนมัติและไม่รวมที่อยู่ที่ถูกปิดเพื่อทำดัชนี
ขอแนะนำให้ปฏิบัติตามคำแนะนำเหล่านี้:
- หากหน้า https://example.com/category/product มีเมตาแท็ก “noindex” ก็ไม่ควรรวมไว้ในแมป XML ของไซต์
- เมื่อปิดหน้าเพื่อสร้างดัชนีผ่าน robots.txt หน้านั้นไม่ควรรวมอยู่ในแมป XML:
ไม่อนุญาต: /category/product
Noindex: /category/product
- หากหน้าถูกปิดเพื่อจัดทำดัชนีผ่าน X-Robots-Tag ในส่วนหัว HTTP หน้านั้นก็ไม่ควรรวมอยู่ในแผนที่ XML ของเว็บไซต์ด้วย:
HTTP/1.1 200 ตกลง
วันที่: อังคาร 25 พฤษภาคม 2010 21:42:43 GMT
(…)
X-Robots-แท็ก: noindex
(…)
เวอร์ชัน Canonical ของเพจ
การเข้าถึงหน้าเดียวผ่าน URL หลายรายการที่มีเนื้อหาคล้ายกันจะถือว่าซ้ำกันโดย Google
คุณต้องใช้แอตทริบิวต์ "link rel canonical" เพื่อสั่งบอตซึ่งเป็นหน้า "หลัก" และควรรวบรวมข้อมูลและจัดทำดัชนี
ตัวอย่างเช่น หากหน้า https://example.com/category/product-1 มี Canonical เป็น https://example.com/product ดังนั้น http://example.com/category/product-1 ก็ไม่ควรเข้าร่วม แผนผังเว็บไซต์ XML
คุณควรดำเนินการตรวจสอบอัตโนมัติ เนื่องจากกระบวนการอัตโนมัติจะทำให้คุณปวดหัวน้อยลง และประหยัดเวลาสำหรับการตรวจสอบด้วยตนเอง
หน้าที่ส่งคืน 200 OK
รวมที่อยู่ที่ส่งคืนการตอบกลับ 200 OK สิ่งสำคัญคือต้องทำการตรวจสอบอัตโนมัติและไม่รวมที่อยู่ที่ส่งคืนคำตอบอื่นที่ไม่ใช่ 200 OK เช่น 404, 301 เป็นต้น
ตัวอย่างเช่น หากหน้า https://example.com/product ส่งกลับคำตอบที่แตกต่างจาก 200 OK หน้าเว็บนั้นก็ไม่ควรเข้าร่วมในแผนผังเว็บไซต์
คุณสามารถใช้เครื่องมือต่อไปนี้เพื่อตรวจสอบ: https://soft.galinov.com/ เพื่อตรวจสอบ
หน้าจากการแบ่งหน้า
ไม่จำเป็นต้องรวมทุกหน้าใน sitemap.xml อย่างแน่นอน บอทฉลาดพอที่จะนำทางจากหน้าแรกในหมวดหมู่ที่เกี่ยวข้องได้หากมีการอธิบายอย่างถูกต้อง ขอแนะนำให้ทำดังต่อไปนี้:
- รวมเฉพาะหน้าหลักของหมวดหมู่
- ทำเครื่องหมายหน้าด้วย rel = next / rel = prev เพื่อให้หุ่นยนต์เห็นการเชื่อมต่อระหว่างกัน
- การแบ่งหน้าแต่ละหน้าควรมี canonical guiding ให้เอง ไม่ใช่หน้าหลัก เพราะถ้าสลับกันก็จะหมายถึงบอกบอทว่า “ผมมีสินค้า 5,000 รายการ 20 หน้าก็ไม่เป็นไร เหมือนกับครั้งแรก”
ตัวอย่างเช่น หน้า https://example.com/category/page-2 ไม่ควรเข้าร่วมในแผนที่ คุณสามารถค้นหาความคิดเห็นอย่างเป็นทางการของ Google รวมถึงคำแนะนำได้ที่นี่:
ลดขนาดไฟล์ให้เล็กสุด
Google และ Bing ได้เพิ่มขนาดไฟล์จาก 10MB เป็น 50MB ในปี 2559 แต่การรักษา Sitemap ของคุณให้มีขนาดเล็กที่สุดยังคงเป็นแนวทางปฏิบัติที่ดี
แน่นอนว่าไม่ใช่เรื่องที่ต้องกังวล แต่ถ้าแผนผังไซต์ของคุณมี URL มากกว่า 50,000 URL หรือขนาดเกิน 50MB ก็ควรแบ่งออกเป็นแผนที่ XML เพิ่มเติม ในกรณีนี้ การอ้างอิงถึงแมป XML ทั้งหมดควรอธิบายไว้ในไฟล์ดัชนีแผนผังเว็บไซต์แยกต่างหาก
ไฟล์ดัชนีแผนผังเว็บไซต์ XML คืออะไร
คุณส่งไฟล์แผนผังเว็บไซต์ได้หลายไฟล์ แต่แต่ละไฟล์ต้องเป็นไปตามกฎข้างต้น หากต้องการ คุณสามารถบีบอัดไฟล์โดยใช้ gzip เพื่อลดขนาดได้ตามต้องการ
รูปแบบ XML ของไฟล์ดัชนีคล้ายกับรูปแบบแผนผังเว็บไซต์ปกติมาก จะต้องมี:
- เปิดและปิดแท็กเป็น ;
- รายการสำหรับแผนผังเว็บไซต์แต่ละรายการที่มีแอตทริบิวต์ XML หลักคือ
- แท็กไปที่แอตทริบิวต์หลัก
รวมแอตทริบิวต์ที่แนะนำไว้ด้วย
หมายเหตุ: ไฟล์ดัชนีแผนผังเว็บไซต์สามารถแสดงรายการแผนที่ที่อยู่ในไซต์เดียวกันเท่านั้น ตัวอย่างเช่น:
https://example.com/sitemap_index.xml อาจรวมแผนที่ที่ https://example.com แต่ไม่ใช่ที่ https://www.saitprimer.com หรือ https://www.example.com
เช่นเดียวกับไฟล์อื่นๆ ไฟล์ดัชนีต้องเข้ารหัสด้วย UTF-8
ตัวอย่างต่อไปนี้แสดงดัชนีแผนผังเว็บไซต์ที่แสดงสองแผนที่:
http://www.example.com/sitemap1.xml.gz
2018-10-01T18:23:17+00:00
http://www.example.com/sitemap2.xml.gz
2017-01-01
คำอธิบายของรุ่นมือถือ
เราจำเป็นต้องช่วยบอทของ Google ในการค้นหาเนื้อหาของเราและเข้าใจความเชื่อมโยงระหว่างหน้าเดสก์ท็อปและมือถือ ในแผนผังไซต์ XML จะต้องเพิ่มแอตทริบิวต์ rel = "ทางเลือก" สำหรับหน้าเวอร์ชันเดสก์ท็อปดังนี้:
xmlns:xhtml=”http://www.w3.org/1999/xhtml”>
http://www.example.com/page-1/
<xhtml:link
rel=”ทางเลือก”
media=”เฉพาะหน้าจอและ (ความกว้างสูงสุด: 640px)”
href=”http://m.example.com/page-1″ />
โปรดทราบว่าหน้าเดสก์ท็อปแต่ละหน้าต้องสอดคล้องกับหน้าของรุ่นมือถือหนึ่งหน้า ไม่แนะนำ ตัวอย่างเช่น ให้เชื่อมโยงหน้าเดสก์ท็อปหลายหน้าผ่าน rel = "ทางเลือก" ไปยังหน้าหนึ่งของเวอร์ชันมือถือและในทางกลับกัน
คุณต้องตรวจสอบการเปลี่ยนเส้นทางด้วย หน้าเดสก์ท็อปต้องสอดคล้องกับเนื้อหาเดียวกันในเวอร์ชันมือถือ และไม่เปลี่ยนเส้นทางไปยังหน้าอื่น ข้อมูลเพิ่มเติมที่นี่
วิธีที่บอทสามารถค้นหา XML Sitemap ของคุณ
เมื่อคุณเสร็จสิ้นกระบวนการอัตโนมัติทั้งหมดและอัปโหลดไปยังเซิร์ฟเวอร์ของคุณ (หรือสร้างโดยปลั๊กอิน) คุณต้องทิ้งเงื่อนงำที่บอทสามารถค้นหาได้
วิธีที่ดีที่สุดคือการรวมลิงก์ไปยังไฟล์ robots.txt ของคุณ สิ่งนี้เรียกว่า Sitemap Discovery และเป็นสิ่งที่ Google, Bing และ Yahoo เปิดตัวในปี 2550 เพื่อช่วยให้หุ่นยนต์ของพวกเขาค้นหา XML Sitemap
สิ่งที่คุณต้องทำคือใส่พาธแบบเต็มไปยังไฟล์แผนที่หรือดัชนีของคุณ
การทับศัพท์ที่ถูกต้องของที่อยู่
เอกสารอย่างเป็นทางการของ Google (สร้างและส่งแผนผังเว็บไซต์) เน้นว่าค่าข้อมูลทั้งหมด (รวมถึง URL) ต้องมีอักขระ ASCII เท่านั้น ต้องไม่มีรหัสควบคุมหรืออักขระพิเศษ เช่น * หรือ {}
หาก URL ของไซต์ของคุณมีอักขระเหล่านี้ คุณจะได้รับข้อผิดพลาดเมื่อพยายามเพิ่ม
ส่งแผนที่ของคุณไปที่ Google
คุณสามารถส่งแผนผังไซต์ของคุณไปยัง Google ผ่าน Google Search Console
ตรวจสอบข้อผิดพลาดก่อนส่ง สิ่งสำคัญคือต้องแก้ไขข้อผิดพลาดที่อาจขัดขวางการสร้างดัชนีหน้า Landing Page ที่สำคัญ
ตามหลักการแล้ว จำนวนหน้าที่จัดทำดัชนีควรเท่ากับจำนวนหน้าที่ส่ง
บทสรุป
- สอดคล้องกัน – หากหน้าถูกบล็อกโดย robots.txt หรือโดย “noindex” จะดีกว่าถ้าไม่อยู่ในแมป XML ของคุณ
- ทำให้กระบวนการของคุณเป็นอัตโนมัติ – คำแนะนำข้างต้นทั้งหมดควรจะพร้อมใช้งานสำหรับการทำงานอัตโนมัติ เนื่องจากวิธีนี้จะช่วยคุณประหยัดเวลา ช่วยให้งบประมาณการรวบรวมข้อมูลมีประสิทธิภาพสูงสุด และยังช่วยให้คุณไม่ต้องปวดหัวอีกด้วย
- หากคุณมีไซต์ขนาดใหญ่มาก ให้ใช้ไฟล์ดัชนีที่มีแผนที่ต่างๆ ซึ่งจะช่วยประหยัดเวลาของเซิร์ฟเวอร์และจะครอบคลุมหน้าที่สำคัญทั้งหมดบนไซต์ของคุณ