XML Sitemap: คำแนะนำที่สำคัญสำหรับการเพิ่มประสิทธิภาพ

เผยแพร่แล้ว: 2021-03-26

Sitemap.xml บนไซต์ของคุณสามารถทำหน้าที่เป็นการนำทางที่ดีสำหรับหน้าที่คุณต้องการให้ Google bot จัดทำดัชนี ช่วยให้คุณค้นหาหน้าหลักได้เร็วขึ้น แม้ว่าคุณจะไม่มีการเชื่อมโยงภายในที่ดี

ในบทความนี้ เราจะนำเสนอคำแนะนำต่างๆ สำหรับการเพิ่มประสิทธิภาพ XML Sitemap และเหตุใดจึงควรทำเช่นนี้

สารบัญ

ฟังก์ชันและข้อดี

แผนผังเว็บไซต์ XML

ทำให้บอททำงานได้ง่ายขึ้นและอนุญาตให้รับ "รายงาน" สำหรับหน้าและลิงก์ในไซต์ของคุณที่หาได้ยาก

ประโยชน์บางประการของ SEO มีดังนี้:

  • การจัดทำดัชนีเร็วขึ้น – เครื่องมือค้นหาจะพบหน้าใหม่ได้เร็วกว่ามาก ดังนั้นกระบวนการสร้างดัชนีและการแสดงเว็บไซต์ในผลการค้นหาจะเร็วขึ้น สิ่งแปลก ๆ ที่นี่คือมันสามารถช่วยคุณในการ deindexing (ข้อมูลเพิ่มเติมที่นี่);
  • การจัดทำดัชนีหน้าภายในที่ดีขึ้น – เครื่องมือค้นหาสามารถค้นหาหน้าที่ไม่พบเมื่อรวบรวมข้อมูลเว็บไซต์ แต่นี่ไม่ได้หมายความว่าพวกเขาทั้งหมดจะถูกจัดทำดัชนีเสมอไป
  • การตรวจสอบหน้าที่จัดทำดัชนี เมื่อใช้ร่วมกับ Google Search Console คุณจะพบว่า URL ใดบ้างที่ครอบคลุมใน XML Sitemap ที่ Google จัดทำดัชนี

XML Sitemap มีความสำคัญหรือไม่

เป็นสิ่งสำคัญสำหรับไซต์ที่:

  • ไม่มีโครงสร้างที่ดีหรือไม่มีการเชื่อมโยงภายในที่ดี

การเชื่อมโยงภายในที่ดีและไม่ดี

  • มีหลายหน้า – แผนผังเว็บไซต์ XML ช่วยให้เครื่องมือค้นหาค้นหาหน้าที่ใหม่หรืออัปเดต

เครื่องมือค้นหาอินโฟกราฟิก

  • ไม่มีลิงก์ขาเข้าจำนวนมาก – นี่จะเป็นวิธีที่ดีในการค้นหาหน้าเว็บของคุณ

ลิงค์อินโฟกราฟิก

ข้อกำหนดและรูปแบบ

Google รองรับรูปแบบแผนผังเว็บไซต์หลายรูปแบบ สามารถดูรูปแบบและมาตรฐานทั้งหมดได้ตามที่อยู่นี้: https://www.sitemaps.org/index.html

รูปแบบทั้งหมดจำกัดแผนผังเว็บไซต์ไว้ที่ 50MB (ไม่บีบอัด) และที่อยู่ 50,000 รายการ หากคุณมีไฟล์ขนาดใหญ่หรือมีที่อยู่มากกว่านี้ คุณจะต้องสร้างไฟล์ดัชนีพร้อมแผนที่ทั้งหมด (อธิบายไว้ในบทความด้านล่าง)

คำแนะนำหลักคือ:

  • ไฟล์ต้องเข้ารหัสด้วย UTF-8
  • ต้องขึ้นต้นด้วยแท็กเปิดและปิดท้ายด้วยแท็กปิดเช่น…. ;
  • ระบุโปรโตคอลมาตรฐานในแท็ก
  • แท็กหลักสำหรับรายการ URL แต่ละรายการ ;
  • ระบุ URL ที่ขึ้นต้นด้วยโปรโตคอล (https หรือ http) ในแท็ก ซึ่งต้องเข้าร่วมในแท็กหลักเพื่อบันทึก

แอตทริบิวต์เสริมเพิ่มเติมสำหรับแผนผังเว็บไซต์ XML

Google ไม่ได้ใช้แอตทริบิวต์นี้ในเว็บไซต์ของตน คุณลักษณะอื่นๆ ทั้งหมดมีให้ใช้งาน แต่ขึ้นอยู่กับว่าจะสะท้อนให้เห็นหรือไม่ ดังนั้น โปรดทราบว่า Google ไม่ได้ให้ความสำคัญกับแท็กเหล่านี้มากนัก พวกเขาคือ:

  • – แสดงถึงวันที่ของการเปลี่ยนแปลงไฟล์ครั้งล่าสุด ต้องอยู่ในรูปแบบ W3C Datetime;
  • – หน้ามีแนวโน้มที่จะอัพเดทบ่อยแค่ไหน ค่านี้ให้ข้อมูลทั่วไปเกี่ยวกับเครื่องมือค้นหา ค่าที่ถูกต้องสามารถเป็นได้เสมอ รายชั่วโมง รายวัน รายสัปดาห์ รายเดือน รายปี ไม่เคยเลย

โปรดทราบว่าค่าของแท็กนี้ถือเป็นคำใบ้มากกว่าคำสั่ง หุ่นยนต์เห็นข้อมูลนี้และนำมาพิจารณา แต่ท้ายที่สุดแล้วตัดสินใจด้วยตัวเองว่าจะใช้ข้อมูลนี้หรือไม่ ทั้งนี้ขึ้นอยู่กับปัจจัยอื่นๆ อีกมาก

  • – จัดลำดับความสำคัญของ URL มากกว่า URL อื่น ๆ ในเว็บไซต์ของคุณ ค่าที่ถูกต้องมีตั้งแต่ 0.0 ถึง 1.0

ขอย้ำอีกครั้งว่าลำดับความสำคัญนี้สัมพันธ์กันและไม่ใช่เงื่อนไขบังคับสำหรับโรบ็อต หรืออย่างน้อยก็ยังไม่เป็นที่ยอมรับ อย่างไรก็ตาม หากคุณตัดสินใจที่จะลองใช้งาน ให้ใช้คำแนะนำต่อไปนี้:

    • 0 – 0.3: ข่าวล้าสมัย ข้อมูลที่ใช้ไม่ได้อีกต่อไป แต่มีประโยชน์ในอดีต
    • 4 – 0.7: บทความบล็อก, หมวดหมู่หน้า, คำถามที่พบบ่อย;
    • 8 – 1.0: หน้าแรก หน้าผลิตภัณฑ์ ทุกหน้าที่มีเนื้อหาที่ปรับให้เหมาะสมที่สุด

ตัวอย่างต่อไปนี้แสดงแผนผังเว็บไซต์ที่มี URL เพียงรายการเดียวและใช้แท็กที่เป็นตัวเลือกทั้งหมดที่เขียนด้วย ตัวเอียง

https://netpeak.bg

2018-09-15

รายเดือน

0.8

การระบุหน้าที่สำคัญ

เพิ่มหน้าคุณภาพสูงและหน้าที่ได้รับการปรับให้เหมาะสม คุณภาพโดยรวมมีความสำคัญอย่างยิ่งสำหรับการจัดอันดับที่ดีขึ้น นี่เป็นปัจจัยสำคัญสำหรับ Google ที่สามารถให้ความสำคัญกับการแข่งขันได้

เราไม่ต้องการเข้าชมหน้าคุณภาพต่ำ บอทของ Google ก็เช่นกัน หากคุณนำไปยังหน้าหลายพันหน้าที่ไม่เป็นประโยชน์ต่อผู้ใช้และไม่ได้รับการปรับให้เหมาะสม การทำเช่นนี้อาจเป็นอันตรายสำหรับคุณเท่านั้น เพจคุณภาพสูงคืออะไร? พูดง่ายๆ คือ หน้าที่:

  • มีเนื้อหาเฉพาะเพียงพอ
  • ดึงดูดผู้ใช้อย่างรวดเร็วด้วยการกระตุ้นให้ดำเนินการ (ความคิดเห็น บทวิจารณ์ ฯลฯ)
  • รวมรูปภาพ วิดีโอ ฯลฯ .;
  • ไม่ละเมิดนโยบายของ Google

หน้าที่เปิดสำหรับการจัดทำดัชนี

โดยทั่วไป งบประมาณการรวบรวมข้อมูลจะแสดงจำนวนหน้าที่รวบรวมข้อมูลต่อหน่วยเวลา (วัน สัปดาห์ เดือน ฯลฯ) ดังนั้นจึงไม่แนะนำให้เสียโดยไม่จำเป็น

ไม่ควรเพิ่มหน้าที่มีเมตาแท็ก "Noindex" ลงในแผนผังไซต์ การทำตามลำดับตรรกะเป็นสิ่งสำคัญสำหรับทุกสิ่ง

จำเป็นต้องทำการตรวจสอบอัตโนมัติและไม่รวมที่อยู่ที่ถูกปิดเพื่อทำดัชนี

ขอแนะนำให้ปฏิบัติตามคำแนะนำเหล่านี้:

  • หากหน้า https://example.com/category/product มีเมตาแท็ก “noindex” ก็ไม่ควรรวมไว้ในแมป XML ของไซต์

ภาพหน้าจอที่ไม่ใช่ดัชนี

  • เมื่อปิดหน้าเพื่อสร้างดัชนีผ่าน robots.txt หน้านั้นไม่ควรรวมอยู่ในแมป XML:

ไม่อนุญาต: /category/product

Noindex: /category/product

  • หากหน้าถูกปิดเพื่อจัดทำดัชนีผ่าน X-Robots-Tag ในส่วนหัว HTTP หน้านั้นก็ไม่ควรรวมอยู่ในแผนที่ XML ของเว็บไซต์ด้วย:

HTTP/1.1 200 ตกลง

วันที่: อังคาร 25 พฤษภาคม 2010 21:42:43 GMT

(…)

X-Robots-แท็ก: noindex

(…)

เวอร์ชัน Canonical ของเพจ

การเข้าถึงหน้าเดียวผ่าน URL หลายรายการที่มีเนื้อหาคล้ายกันจะถือว่าซ้ำกันโดย Google

คุณต้องใช้แอตทริบิวต์ "link rel canonical" เพื่อสั่งบอตซึ่งเป็นหน้า "หลัก" และควรรวบรวมข้อมูลและจัดทำดัชนี

อินโฟกราฟิกเว็บไซต์เวอร์ชันมาตรฐาน

ตัวอย่างเช่น หากหน้า https://example.com/category/product-1 มี Canonical เป็น https://example.com/product ดังนั้น http://example.com/category/product-1 ก็ไม่ควรเข้าร่วม แผนผังเว็บไซต์ XML

คุณควรดำเนินการตรวจสอบอัตโนมัติ เนื่องจากกระบวนการอัตโนมัติจะทำให้คุณปวดหัวน้อยลง และประหยัดเวลาสำหรับการตรวจสอบด้วยตนเอง

หน้าที่ส่งคืน 200 OK

รวมที่อยู่ที่ส่งคืนการตอบกลับ 200 OK สิ่งสำคัญคือต้องทำการตรวจสอบอัตโนมัติและไม่รวมที่อยู่ที่ส่งคืนคำตอบอื่นที่ไม่ใช่ 200 OK เช่น 404, 301 เป็นต้น

ตัวอย่างเช่น หากหน้า https://example.com/product ส่งกลับคำตอบที่แตกต่างจาก 200 OK หน้าเว็บนั้นก็ไม่ควรเข้าร่วมในแผนผังเว็บไซต์

ตรวจสอบส่วนหัวการตอบสนอง HTTP

คุณสามารถใช้เครื่องมือต่อไปนี้เพื่อตรวจสอบ: https://soft.galinov.com/ เพื่อตรวจสอบ

หน้าจากการแบ่งหน้า

ไม่จำเป็นต้องรวมทุกหน้าใน sitemap.xml อย่างแน่นอน บอทฉลาดพอที่จะนำทางจากหน้าแรกในหมวดหมู่ที่เกี่ยวข้องได้หากมีการอธิบายอย่างถูกต้อง ขอแนะนำให้ทำดังต่อไปนี้:

  • รวมเฉพาะหน้าหลักของหมวดหมู่
  • ทำเครื่องหมายหน้าด้วย rel = next / rel = prev เพื่อให้หุ่นยนต์เห็นการเชื่อมต่อระหว่างกัน
  • การแบ่งหน้าแต่ละหน้าควรมี canonical guiding ให้เอง ไม่ใช่หน้าหลัก เพราะถ้าสลับกันก็จะหมายถึงบอกบอทว่า “ผมมีสินค้า 5,000 รายการ 20 หน้าก็ไม่เป็นไร เหมือนกับครั้งแรก”

ตัวอย่างเช่น หน้า https://example.com/category/page-2 ไม่ควรเข้าร่วมในแผนที่ คุณสามารถค้นหาความคิดเห็นอย่างเป็นทางการของ Google รวมถึงคำแนะนำได้ที่นี่:

ลดขนาดไฟล์ให้เล็กสุด

Google และ Bing ได้เพิ่มขนาดไฟล์จาก 10MB เป็น 50MB ในปี 2559 แต่การรักษา Sitemap ของคุณให้มีขนาดเล็กที่สุดยังคงเป็นแนวทางปฏิบัติที่ดี

Bing และ google sitemaps

แน่นอนว่าไม่ใช่เรื่องที่ต้องกังวล แต่ถ้าแผนผังไซต์ของคุณมี URL มากกว่า 50,000 URL หรือขนาดเกิน 50MB ก็ควรแบ่งออกเป็นแผนที่ XML เพิ่มเติม ในกรณีนี้ การอ้างอิงถึงแมป XML ทั้งหมดควรอธิบายไว้ในไฟล์ดัชนีแผนผังเว็บไซต์แยกต่างหาก

ไฟล์ดัชนีแผนผังเว็บไซต์ XML คืออะไร

อินโฟกราฟิกไฟล์ดัชนีแผนผังเว็บไซต์

คุณส่งไฟล์แผนผังเว็บไซต์ได้หลายไฟล์ แต่แต่ละไฟล์ต้องเป็นไปตามกฎข้างต้น หากต้องการ คุณสามารถบีบอัดไฟล์โดยใช้ gzip เพื่อลดขนาดได้ตามต้องการ

รูปแบบ XML ของไฟล์ดัชนีคล้ายกับรูปแบบแผนผังเว็บไซต์ปกติมาก จะต้องมี:

  • เปิดและปิดแท็กเป็น ;
  • รายการสำหรับแผนผังเว็บไซต์แต่ละรายการที่มีแอตทริบิวต์ XML หลักคือ
  • แท็กไปที่แอตทริบิวต์หลัก

รวมแอตทริบิวต์ที่แนะนำไว้ด้วย

หมายเหตุ: ไฟล์ดัชนีแผนผังเว็บไซต์สามารถแสดงรายการแผนที่ที่อยู่ในไซต์เดียวกันเท่านั้น ตัวอย่างเช่น:

https://example.com/sitemap_index.xml อาจรวมแผนที่ที่ https://example.com แต่ไม่ใช่ที่ https://www.saitprimer.com หรือ https://www.example.com

เช่นเดียวกับไฟล์อื่นๆ ไฟล์ดัชนีต้องเข้ารหัสด้วย UTF-8

ตัวอย่างต่อไปนี้แสดงดัชนีแผนผังเว็บไซต์ที่แสดงสองแผนที่:

http://www.example.com/sitemap1.xml.gz

2018-10-01T18:23:17+00:00

http://www.example.com/sitemap2.xml.gz

2017-01-01

คำอธิบายของรุ่นมือถือ

เราจำเป็นต้องช่วยบอทของ Google ในการค้นหาเนื้อหาของเราและเข้าใจความเชื่อมโยงระหว่างหน้าเดสก์ท็อปและมือถือ ในแผนผังไซต์ XML จะต้องเพิ่มแอตทริบิวต์ rel = "ทางเลือก" สำหรับหน้าเวอร์ชันเดสก์ท็อปดังนี้:

xmlns:xhtml=”http://www.w3.org/1999/xhtml”>

http://www.example.com/page-1/

<xhtml:link

rel=”ทางเลือก”

media=”เฉพาะหน้าจอและ (ความกว้างสูงสุด: 640px)”

href=”http://m.example.com/page-1″ />

โปรดทราบว่าหน้าเดสก์ท็อปแต่ละหน้าต้องสอดคล้องกับหน้าของรุ่นมือถือหนึ่งหน้า ไม่แนะนำ ตัวอย่างเช่น ให้เชื่อมโยงหน้าเดสก์ท็อปหลายหน้าผ่าน rel = "ทางเลือก" ไปยังหน้าหนึ่งของเวอร์ชันมือถือและในทางกลับกัน

คุณต้องตรวจสอบการเปลี่ยนเส้นทางด้วย หน้าเดสก์ท็อปต้องสอดคล้องกับเนื้อหาเดียวกันในเวอร์ชันมือถือ และไม่เปลี่ยนเส้นทางไปยังหน้าอื่น ข้อมูลเพิ่มเติมที่นี่

อินโฟกราฟิกเปลี่ยนเส้นทางมือถือ

วิธีที่บอทสามารถค้นหา XML Sitemap ของคุณ

เมื่อคุณเสร็จสิ้นกระบวนการอัตโนมัติทั้งหมดและอัปโหลดไปยังเซิร์ฟเวอร์ของคุณ (หรือสร้างโดยปลั๊กอิน) คุณต้องทิ้งเงื่อนงำที่บอทสามารถค้นหาได้

วิธีที่ดีที่สุดคือการรวมลิงก์ไปยังไฟล์ robots.txt ของคุณ สิ่งนี้เรียกว่า Sitemap Discovery และเป็นสิ่งที่ Google, Bing และ Yahoo เปิดตัวในปี 2550 เพื่อช่วยให้หุ่นยนต์ของพวกเขาค้นหา XML Sitemap

สิ่งที่คุณต้องทำคือใส่พาธแบบเต็มไปยังไฟล์แผนที่หรือดัชนีของคุณ

ภาพหน้าจอของไฟล์ดัชนีเส้นทางแบบเต็ม

การทับศัพท์ที่ถูกต้องของที่อยู่

เอกสารอย่างเป็นทางการของ Google (สร้างและส่งแผนผังเว็บไซต์) เน้นว่าค่าข้อมูลทั้งหมด (รวมถึง URL) ต้องมีอักขระ ASCII เท่านั้น ต้องไม่มีรหัสควบคุมหรืออักขระพิเศษ เช่น * หรือ {}

หาก URL ของไซต์ของคุณมีอักขระเหล่านี้ คุณจะได้รับข้อผิดพลาดเมื่อพยายามเพิ่ม

ส่งแผนที่ของคุณไปที่ Google
คุณสามารถส่งแผนผังไซต์ของคุณไปยัง Google ผ่าน Google Search Console

ภาพหน้าจอคอนโซลการค้นหาของ Google

ตรวจสอบข้อผิดพลาดก่อนส่ง สิ่งสำคัญคือต้องแก้ไขข้อผิดพลาดที่อาจขัดขวางการสร้างดัชนีหน้า Landing Page ที่สำคัญ

ตามหลักการแล้ว จำนวนหน้าที่จัดทำดัชนีควรเท่ากับจำนวนหน้าที่ส่ง

บทสรุป

  1. สอดคล้องกัน – หากหน้าถูกบล็อกโดย robots.txt หรือโดย “noindex” จะดีกว่าถ้าไม่อยู่ในแมป XML ของคุณ
  2. ทำให้กระบวนการของคุณเป็นอัตโนมัติ – คำแนะนำข้างต้นทั้งหมดควรจะพร้อมใช้งานสำหรับการทำงานอัตโนมัติ เนื่องจากวิธีนี้จะช่วยคุณประหยัดเวลา ช่วยให้งบประมาณการรวบรวมข้อมูลมีประสิทธิภาพสูงสุด และยังช่วยให้คุณไม่ต้องปวดหัวอีกด้วย
  3. หากคุณมีไซต์ขนาดใหญ่มาก ให้ใช้ไฟล์ดัชนีที่มีแผนที่ต่างๆ ซึ่งจะช่วยประหยัดเวลาของเซิร์ฟเวอร์และจะครอบคลุมหน้าที่สำคัญทั้งหมดบนไซต์ของคุณ