วิธีเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของคุณ

เผยแพร่แล้ว: 2017-07-05

ในเดือนพฤษภาคม เราได้จัดสัมมนาผ่านเว็บเป็นภาษาฝรั่งเศสเกี่ยวกับงบประมาณการรวบรวมข้อมูลของ Google สำหรับการสัมมนาผ่านเว็บครั้งที่ 2 กับ OnCrawl Erle Alberton อดีตหัวหน้าฝ่าย SEO ของ Orange & Sosh (ผู้ให้บริการอินเทอร์เน็ตในฝรั่งเศส) และตอนนี้ Customer Success Manager สำหรับ OnCrawl ได้แนะนำแนวคิดงบประมาณการรวบรวมข้อมูล แนวทางปฏิบัติที่ดีที่สุดในการปรับให้เหมาะสม สิ่งที่ควรหลีกเลี่ยง ฯลฯ ตัวอย่างจะแสดงให้เห็นแนวคิดนี้ซึ่งเพิ่งได้รับการยืนยันโดยทีมงานของ Google

สิ่งที่ Google พูดเกี่ยวกับงบประมาณการรวบรวมข้อมูล

กลางเดือนมกราคม Google โพสต์บทความใน บล็อกของพวกเขา โดย ระบุว่า: "เราไม่มีคำใดคำเดียวที่จะอธิบายทุกอย่างที่ "งบประมาณการรวบรวมข้อมูล" หมายถึงภายนอก ” กล่าวอีกนัยหนึ่งสิ่งที่เรา SEOs ถือเป็นงบประมาณการรวบรวมข้อมูล

เว็บยักษ์ยังระบุด้วยว่าหากหน้าใหม่ของคุณมักจะถูกรวบรวมข้อมูลในวันเดียวกับที่เผยแพร่ คุณไม่ต้องกังวลกับงบประมาณการรวบรวมข้อมูลจริงๆ นอกจากนี้ยังระบุด้วยว่าหากเว็บไซต์มี URL น้อยกว่าสองสามพัน URL จะถูกรวบรวมข้อมูลอย่างถูกต้อง เนื่องจากงบประมาณการรวบรวมข้อมูลมักจะสงวนไว้สำหรับเว็บไซต์ที่มีปริมาณมาก... ซึ่งทั้งถูกและผิดเพราะทุกเว็บไซต์ใน Google Search Console มีงบประมาณในการรวบรวมข้อมูล เราสามารถเห็นสิ่งนี้ได้ง่ายในตัวชี้วัดของ Google

เรายังพบในบทความนี้ว่า Google พยายามบรรลุ "ขีดจำกัดอัตราการรวบรวมข้อมูล" ซึ่งจำกัดอัตราการดึงข้อมูลสูงสุดสำหรับไซต์หนึ่งๆ เราจะเห็นได้ว่า ตัวอย่างเช่น เมื่อเวลาในการโหลดนานเกินไป Google จะลดงบประมาณลงเกือบ 2 เท่า โดยที่กล่าวไปแล้วมีปัจจัยที่อาจส่งผลต่องบประมาณการรวบรวมข้อมูล เช่น สถาปัตยกรรมที่ไม่ดี (ระบบ รหัสสถานะ โครงสร้างภายใน ) เนื้อหาไม่ดีและ / หรือซ้ำซ้อน กับดักแมงมุม ฯลฯ

งบประมาณการรวบรวมข้อมูลของ Google ทำงานอย่างไร

การรวบรวมข้อมูลของ Google เป็นชุดขั้นตอนง่ายๆ ที่ทำงานซ้ำกันสำหรับแต่ละไซต์ นี่คือกราฟจาก Google ที่เราเห็นว่าการรวบรวมข้อมูลเริ่มต้นด้วยการตีบนโรบ็อต txt จากนั้นจะแยกเป็นชุดของ URL ที่รวบรวมไว้ในรายการ Afterwords Google พยายามดึงข้อมูลเหล่านี้ในขณะที่เปรียบเทียบกับ URL ที่เขารู้อยู่แล้วนอกเหนือจากที่เขามีในการสำรองข้อมูลอยู่แล้ว

เป้าหมายของมันคือการทำดัชนีให้ครบถ้วนสมบูรณ์และแม่นยำ เราเห็นว่าแม้ว่าไซต์จะใช้ JavaScript แต่ Google จะส่งโปรแกรมรวบรวมข้อมูลระดับที่สาม คุณยังคงควรระมัดระวังเกี่ยวกับไซต์ JavaScript เนื่องจากไซต์ใช้ทรัพยากรบอทจำนวนมากและถูกส่งโดยเฉลี่ยเพียงไตรมาสละครั้ง เราต้องคิดใหม่เกี่ยวกับวิธีการของเราเพื่อให้ Google สามารถเข้าถึงหน้านอกการนำทาง JavaScript

จากนั้น Google จะตรวจสอบสถานะของการอัปเดตหน้าเว็บ (เปรียบเทียบกับเนื้อหาที่จัดทำดัชนีไว้ก่อนหน้านี้) เพื่อประเมินว่าหน้านั้นสำคัญหรือน้อยกว่า อันที่จริง Google จำเป็นต้องเพิ่มประสิทธิภาพทรัพยากรการรวบรวมข้อมูลเพราะไม่สามารถรวบรวมข้อมูลทุกหน้าของเว็บไซต์ทั้งหมดได้ เรียกว่าความสำคัญของเพจ… เป็นคะแนนที่สำคัญมากที่ต้องติดตาม และเราจะดูรายละเอียดด้านล่าง!

ข้อเท็จจริง: หาก Google ปรับให้เหมาะสม ก็เพราะมีเหตุผล

งบประมาณการรวบรวมข้อมูลขึ้นอยู่กับ:

  • ความสามารถของไซต์ในการตอบอย่างรวดเร็ว
  • สติของไซต์ – 4xx, 5xx, 3xx (เมื่อไซต์เริ่มมี 404 หรือ 500 วินาที งบประมาณการรวบรวมข้อมูลจะได้รับผลกระทบ เนื่องจากจะตรวจสอบอีกครั้งเสมอว่ามีการแก้ไขหรือไม่)
  • คุณภาพของเนื้อหา – ความหมายและความครบถ้วนสมบูรณ์;
  • ความหลากหลายของ Anchor (เพจจะถือว่าสำคัญเมื่อได้รับลิงก์จำนวนมาก ด้วย InRank ของ OnCrawl คุณสามารถวิเคราะห์ได้ทั้งหมด);
  • ความนิยมของหน้า – ภายนอกและภายใน;
  • ปัจจัยที่เหมาะสม - ทำให้การรวบรวมข้อมูลง่ายขึ้น (ลดขนาดรูปภาพ ความจุในการมี css, js, gif, แบบอักษร ฯลฯ)

[กรณีศึกษา] เพิ่มงบประมาณการรวบรวมข้อมูลในหน้ากลยุทธ์

การเข้าชมของ Managemento ส่วนใหญ่มาจากการค้นหาทั่วไป การเข้าชมนี้อาศัยการค้นหาหางยาวเป็นหลัก ทำให้เกิดความจำเป็นในการเพิ่มประสิทธิภาพสำหรับคำหลักหลายล้านคำในเวลาเดียวกัน งบประมาณการรวบรวมข้อมูลกลายเป็นปัญหาอย่างรวดเร็ว
อ่านกรณีศึกษา

องค์ประกอบหลักของ Google Page Importance

คำจำกัดความความสำคัญของหน้าไม่เหมือนกับอันดับของหน้า:

  • ตำแหน่งหน้าในเว็บไซต์ – ความลึกของอัตราการรวบรวมข้อมูล;
  • อันดับของเพจ: TF/CF ของเพจ – Majestic;
  • อันดับเพจภายใน – InRank ของ OnCrawl;
  • ประเภทของเอกสาร : PDF, HTML, TXT (PDF มักจะเป็นเอกสารคุณภาพขั้นสุดท้ายจึงได้รับการรวบรวมข้อมูลเป็นจำนวนมาก);
  • รวมอยู่ใน sitemap.xml;
  • จำนวนลิงค์ภายใน:
  • คุณภาพ/ความสำคัญของสมอ
  • เนื้อหาเชิงคุณภาพ: จำนวนคำ ซ้ำกันไม่กี่คำ (Google จะลงโทษเนื้อหาที่คล้ายกันหากหน้ามีเนื้อหาใกล้เกินไป)
  • ความสำคัญของหน้า "หน้าแรก"'

วิธีวางแผน URL สำคัญที่จะรวบรวมข้อมูล

การตั้งเวลา URL: Google ต้องการเข้าชมหน้าใดบ้างและบ่อยแค่ไหน

ในตัวอย่างข้างต้น (การสังเกตความถี่ในการรวบรวมข้อมูลของไซต์เดียวกัน) Google จะไม่รวบรวมข้อมูลที่ความถี่เดียวกันในกลุ่มต่างๆ เราพบว่าเมื่อ Google รวบรวมข้อมูลบางส่วนของไซต์ ผลกระทบของการจัดอันดับจะเห็นได้อย่างรวดเร็ว

ข้อมูลเพิ่มเติมเกี่ยวกับงบประมาณการรวบรวมข้อมูลของ Google

  • 100% ของเว็บไซต์ของ Google Search Console มีข้อมูลการรวบรวมข้อมูล
  • เราสามารถติดตามพฤติกรรมการรวบรวมข้อมูลของมันได้ด้วยการวิเคราะห์บันทึกที่ช่วยให้คุณตรวจพบความผิดปกติในพฤติกรรมของบอทได้อย่างรวดเร็ว
  • โครงสร้างภายในที่ไม่ดี (การแบ่งหน้า หน้าเด็กกำพร้า กับดักแมงมุม) สามารถหยุด Google จากการรวบรวมข้อมูลจากหน้าที่ถูกต้อง
  • งบประมาณการรวบรวมข้อมูลเชื่อมโยงโดยตรงกับการจัดอันดับ

เพจความเร็วก่อน

ปัจจัยที่สำคัญที่สุดคือความเร็วในการโหลดหน้าเว็บ เนื่องจากมีบทบาทสำคัญในงบประมาณการรวบรวมข้อมูล อันที่จริง วันนี้เราอยู่ในโลกของมือถือ เนื้อหาที่ดีที่สุดของคุณคือเวลาในการโหลดหน้าเว็บเพื่อเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลและ SEO ของคุณ ด้วยการปฏิวัติของอุปกรณ์พกพา เวลาในการโหลดจึงเป็นปัจจัยสำคัญในการประเมินคุณภาพของไซต์ ความสามารถในการตอบสนองอย่างรวดเร็ว – โดยเฉพาะอย่างยิ่งสำหรับมือถือและดัชนีมือถือก่อน

เพื่อเพิ่มประสิทธิภาพ เราสามารถใช้ โซลูชัน CDN (เครือข่ายการจัดส่งเนื้อหา) เช่น Cloudflare โซลูชันเหล่านี้ช่วยให้โรบ็อตของ Google อยู่ใกล้กับทรัพยากรมากที่สุดและโหลดหน้าเว็บได้โดยเร็วที่สุด

Google ทดสอบความสามารถของไซต์ในการตอบสนองอย่างรวดเร็วอย่างต่อเนื่อง สถาปัตยกรรมและคุณภาพการเข้ารหัสมีผลกระทบอย่างมากต่อสัญกรณ์ของ Google

เวลาในการโหลด

เป็นปัจจัยการจัดสรรครั้งแรกของงบประมาณการรวบรวมข้อมูล!

เซิร์ฟเวอร์ ที่ชาญฉลาด คุณต้อง:

  • หลีกเลี่ยงการเปลี่ยนเส้นทาง
  • อนุญาตการบีบอัด;
  • ปรับปรุงเวลาตอบสนอง

ด้านบน ตัวอย่างกับ ไซต์ ของ Managemento ซึ่งมีงบประมาณการรวบรวมข้อมูลเชิงเส้นและที่ซึ่งเราสามารถเห็นการเพิ่มขึ้นเชิงเส้น ในเดือนพฤษภาคม จำนวนหน้าที่รวบรวมข้อมูลต่อวันลดลง ส่งผลให้ความเร็วของไซต์เปลี่ยนแปลง Google เห็นว่าไซต์ตอบสนองได้เร็วน้อยลง จึงลดงบประมาณในการรวบรวมข้อมูลลงครึ่งหนึ่ง ในการแก้ไขทั้งหมดนี้ คุณต้องปรับโค้ดของคุณบนฝั่งเซิร์ฟเวอร์ให้เหมาะสม ลดการเปลี่ยนเส้นทาง ใช้การบีบอัด และอื่นๆ

อย่าง ชาญ ฉลาด คุณต้อง:

  • ใช้งานการแคชเบราว์เซอร์
  • ลดขนาดทรัพยากร (การเพิ่มประสิทธิภาพภาพ ใช้ CDN/การโหลดแบบขี้เกียจ/ลบ JS ที่บล็อกการแสดงผล
  • ใช้สคริปต์แบบอะซิงโครนัส

คุณภาพลดลง = ไม่มีความรัก = ไม่มีงบประมาณอีกต่อไป

จำเป็นต้องตรวจสอบรหัสสถานะที่ส่งกลับไปยังโรบ็อตของ Google เพื่อให้แน่ใจว่า IS นั้นสะอาด นี่เป็นวิธีเดียวที่ Google จะตรวจสอบว่าคุณภาพของโค้ดและสถาปัตยกรรมของคุณนั้นสะอาด

การติดตามวิวัฒนาการเมื่อเวลาผ่านไปทำให้มั่นใจได้ว่าการอัปเดตโค้ดนั้นเป็นมิตรกับ SEO Google ใช้ทรัพยากรเป็นจำนวนมาก (css, img, js) ดังนั้นตรวจสอบให้แน่ใจว่าไม่มีที่ติ

เนื้อหาที่ไม่ซ้ำใครและหลากหลาย

หน้าที่สำคัญยิ่งมีเนื้อหามากขึ้น ดังที่แสดงไว้ข้างต้น จำนวนหน้าที่รวบรวมข้อมูลและไม่ได้รวบรวมข้อมูลโดย Google จะสัมพันธ์กับจำนวนคำที่อยู่ในหน้า หน้าของคุณควรได้รับการปรับปรุงและปรับปรุงอย่างสม่ำเสมอที่สุด

ระวังกฎบัญญัติและเนื้อหาที่ซ้ำกัน

Google จะใช้งบประมาณเป็นสองเท่าเมื่อหน้าที่คล้ายกันสองหน้าไม่ชี้ไปที่ URL ตามรูปแบบบัญญัติเดียวกัน ดังนั้น การจัดการตามรูปแบบบัญญัติจึงมีความสำคัญสำหรับไซต์ที่มีแง่มุม หรือลิงก์ภายนอกที่มี queryString

การจัดการเนื้อหาที่เกือบซ้ำกันและ Canonicals กลายเป็นส่วนสำคัญของการเพิ่มประสิทธิภาพงบประมาณการตระเวน

โครงสร้างภายในและการกระจาย InRank

เพจที่สร้างการเข้าชม SEO จะถือว่าเปิดใช้งานอยู่ สิ่งเหล่านี้เป็นสิ่งที่อยู่ด้านบนสุดของสถาปัตยกรรมของไซต์ ในทางกลับกัน เราเห็นว่าในหน้า 15 มีกลุ่มของเพจปรากฏขึ้น บางทีหน้าเหล่านี้อาจมีการค้นหาโดยผู้ใช้ของคุณมากกว่าที่คุณคิด และจำเป็นต้องได้รับการอัปเกรดในสถาปัตยกรรมเพื่อปรับปรุงอันดับของพวกเขา

อย่างที่เราทราบ ยิ่งหน้ายิ่งลึก Google จะเข้าชมน้อยลง!

หน้าเงินของฉันอยู่ในตำแหน่งที่ดีหรือไม่?

เคล็ดลับ: หากคุณต้องการปรับความลึกของกลุ่มหน้าบางกลุ่ม อย่าลังเลที่จะสร้างแผนไซต์ html ซึ่งหมายถึงหน้าที่มีความสำคัญต่อการจัดการความลึกของคุณ

Google จะเปรียบเทียบหน้าของโครงสร้างของคุณกับที่รวบรวมข้อมูลและใช้งานอยู่ ที่กล่าวว่าจะเป็นข้อได้เปรียบของคุณในการแก้ปัญหาหน้าที่ไม่มีโครงสร้างซึ่ง Google ใช้งบประมาณโดยไม่จำเป็น และแก้ไขสถาปัตยกรรมของไซต์เพื่อส่งคืนลิงก์ไปยังหน้าที่ทำงานอยู่แต่ไม่อยู่ในโครงสร้าง

บางครั้งเพจไม่ได้รับลิงค์อีกต่อไป เรียกว่าเพจกำพร้า ในทางกลับกัน Google ยังไม่ลืมพวกเขา เขาจะไปเยี่ยมพวกเขาต่อไป พวกเขาไม่ได้รับลิงก์อีกต่อไป ดังนั้นพวกเขาจึงสูญเสียความสำคัญไป แต่ในกราฟที่ถูกต้อง หน้าที่ถูกละเลยบางหน้ายังคงได้รับการเข้าชม SEO สิ่งที่คุณต้องรู้คือวิธีระบุได้อย่างรวดเร็วและแก้ไขปัญหาการเชื่อมโยงที่อยู่ในสถาปัตยกรรม นี่เป็นวิธีที่ยอดเยี่ยมในการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของคุณ

ข้อผิดพลาดที่จะอยู่ห่างจาก

  • Robots.txt ใน 404;
  • Sitemap.xml & sitemap.html ล้าสมัย;
  • ข้อผิดพลาด 50x / 40x / soft 404;
  • มีการเปลี่ยนเส้นทางลูกโซ่
  • ข้อผิดพลาด Canonicals;
  • เนื้อหาซ้ำ (ส่วนท้าย) / ใกล้ซ้ำ / HTTP เทียบกับ HTTPS;
  • เวลาตอบสนองนานเกินไป
  • ความหนักของหน้าสำคัญเกินไป
  • แอมป์/ข้อผิดพลาด Google ใช้โปรโตคอลนี้กันอย่างแพร่หลายโดยเฉพาะสำหรับไซต์อีคอมเมิร์ซ (ไม่ใช่แค่ไซต์สื่อ)
  • การเชื่อมโยงภายในไม่ดี + Rel=nofollow;
  • การใช้ JS โดยไม่มีทางเลือกอื่น

บทสรุป

ในการเพิ่มประสิทธิภาพงบประมาณการตระเวนของคุณ คุณต้อง:

  • รู้จักหน้าเงินของคุณและรู้ปฏิกิริยาของ Google;
  • ปรับปรุงเวลาโหลด;
  • เพิ่มประสิทธิภาพการเชื่อมโยงภายในของคุณ: ใส่หน้าเงินทั้งหมดของคุณที่ด้านบนสุดของโครงสร้าง
  • แก้ไขหน้ากำพร้าของคุณ
  • เพิ่มข้อความในหน้าเงินของคุณ
  • อัปเดตหน้าเงินของคุณอย่างเต็มที่ – ความสด;
  • ลดเนื้อหาที่ไม่ดีและรายการที่ซ้ำกันของคุณ
  • ปรับ Canonical, รูปภาพ, น้ำหนักทรัพยากรของคุณให้เหมาะสม;
  • หลีกเลี่ยงการเปลี่ยนเส้นทางลูกโซ่
  • ตรวจสอบบันทึกของคุณและตอบสนองเมื่อมีความผิดปกติ (ตรวจสอบ กรณีการใช้งานนี้จาก Manageo ระหว่าง SEOcamp Lyon ในหัวข้อ)

ในการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของคุณ คุณต้องตรวจสอบโปรแกรมรวบรวมข้อมูลของ Google อย่างแม่นยำ

บางช่วงเวลาของเส้นทางของ Google บนไซต์ของคุณมีความสำคัญมากกว่าช่วงเวลาอื่นๆ ดังนั้นคุณต้องรู้วิธีเพิ่มประสิทธิภาพเหล่านั้น

ในการเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลของคุณ จำเป็นต้องจัดการการย้ายข้อมูล HTTPS (HTTP2) อย่างถูกต้อง

คุณต้องสามารถติดตามและตรวจสอบได้ ท้าทายทีมไอทีของคุณเพื่อโยกย้ายไปยัง HTTP2 ด้วย HTTPS
OnCrawl ช่วยให้คุณติดตามงบประมาณการรวบรวมข้อมูลของ Google แบบวันต่อวัน และกำหนดเป้าหมายการแก้ไขและการเปลี่ยนแปลงโครงสร้างอย่างรวดเร็วเพื่อปรับปรุงประสิทธิภาพ SEO ของคุณ

เริ่มทดลองใช้งานฟรี 14 วัน

ค้นหาด้วยตัวคุณเองว่าทำไม Oncrawl จึงเป็นแพลตฟอร์ม SEO ด้านเทคนิคและข้อมูลที่ได้รับการยอมรับมากที่สุดในตลาด! ไม่ต้องใช้บัตรเครดิตและไม่มีข้อผูกมัด: เพียง 14 วันของการทดลองใช้งานเต็มรูปแบบ
เริ่มการทดลองใช้ของคุณ