การวิเคราะห์ไฟล์บันทึก: ทางเลือกอันชาญฉลาดสำหรับ Google Analytics

เผยแพร่แล้ว: 2022-03-08

คุณรู้หรือไม่ว่าเกิดอะไรขึ้นบนเว็บไซต์ของคุณทุกวัน? สิ่งแรกที่นึกถึงเมื่อตอบคำถามนี้มักจะใช้เครื่องมือติดตามผู้ชมและพฤติกรรม มีเครื่องมือดังกล่าวมากมายในตลาด เช่น Google Analytics, At Internet, Matomo, Fathom Analytics และ Simple Analytics เป็นต้น แม้ว่าเครื่องมือเหล่านี้จะช่วยให้เรามีภาพรวมที่ดีทีเดียวว่าเกิดอะไรขึ้นในช่วงเวลาใดก็ตามบนเว็บไซต์ของเรา หลักปฏิบัติด้านจริยธรรมที่ใช้เครื่องมือเหล่านี้ โดยเฉพาะ Google Analytics กลับถูกตั้งคำถามอีกครั้ง

นี่แสดงให้เห็นว่ามีแหล่งข้อมูลอื่นๆ ที่ยังไม่ถูกใช้ประโยชน์อย่างเพียงพอจากเจ้าของเว็บไซต์ทั้งหมดในปัจจุบัน: บันทึก

เครื่องมือวิเคราะห์และ GDPR (เน้นที่ Google Analytics)

ข้อมูลส่วนบุคคลกลายเป็นเรื่องละเอียดอ่อนในฝรั่งเศสนับตั้งแต่มีการนำกฎระเบียบให้ความคุ้มครองข้อมูลส่วนบุคคลของผู้บริโภค (GDPR) ไปใช้และการจัดตั้งคณะกรรมการแห่งชาติด้านสารสนเทศและเสรีภาพ (CNIL) การปกป้องข้อมูลได้กลายเป็นสิ่งสำคัญ

เว็บไซต์ของคุณยัง “เป็นมิตรกับ GDPR” หรือไม่

หากเราดูที่เว็บไซต์ทั้งหมด เราจะพบว่าหลาย ๆ คนพบวิธีที่จะหลีกเลี่ยงกฎโดยใช้คุกกี้ (แบนเนอร์การรวบรวมข้อมูล) เพื่อรวบรวมข้อมูลที่ต้องการ ในขณะที่เว็บไซต์อื่นๆ ยังคงปฏิบัติตามกฎระเบียบที่เป็นทางการอย่างเคร่งครัด

ด้วยการรวบรวมข้อมูลนี้ เครื่องมือวิเคราะห์ข้อมูลช่วยให้เราสามารถวิเคราะห์ว่าผู้ชมมาจากไหนและพฤติกรรมของผู้เข้าชม การวิเคราะห์ประเภทนี้ต้องการแผนการติดแท็กที่ไร้ที่ติเพื่อรวบรวมข้อมูลที่น่าเชื่อถือและแม่นยำที่สุดเท่าที่จะเป็นไปได้ และท้ายที่สุด ข้อมูลที่รวบรวมก็เป็นผลมาจากการกระทำและเหตุการณ์แต่ละอย่างในไซต์

หลังจากการร้องเรียนจำนวนหนึ่ง CNIL ได้ตัดสินใจที่จะแจ้ง Google Analytics โดยกำหนดให้ผิดกฎหมายในฝรั่งเศสในขณะนี้ การคว่ำบาตรนี้มาจากการขาดการดูแลที่ชัดเจนเกี่ยวกับการถ่ายโอนข้อมูลส่วนบุคคลไปยังบริการข่าวกรองในสหรัฐอเมริกา แม้ว่าข้อมูลผู้เยี่ยมชมจะได้รับการเก็บรวบรวมโดยได้รับความยินยอมก่อนหน้านี้ ควรติดตามพัฒนาการอย่างใกล้ชิด

ในบริบทปัจจุบันนี้ ด้วยการเข้าถึง Google Analytics ที่จำกัดหรือไม่มีเลย การดูตัวเลือกการรวบรวมข้อมูลอื่นๆ อาจเป็นเรื่องที่น่าสนใจ การรวบรวมเหตุการณ์ทางประวัติศาสตร์ของไซต์และการกู้คืนที่ค่อนข้างง่าย ล็อกไฟล์เป็นแหล่งข้อมูลที่ดี

แม้ว่าไฟล์บันทึกจะช่วยให้เข้าถึงคลังข้อมูลที่น่าสนใจเพื่อวิเคราะห์ แต่ก็ไม่อนุญาตให้เราแสดงคุณค่าทางธุรกิจหรือพฤติกรรมที่แท้จริงของผู้เยี่ยมชมเว็บไซต์ เช่น การนำทางเว็บไซต์ตั้งแต่เริ่มต้นจนถึงเวลาที่เขาหรือเธอตรวจสอบตะกร้าสินค้าหรือออกจาก เว็บไซต์. อย่างไรก็ตาม ด้านพฤติกรรมยังคงมีความเฉพาะเจาะจงกับเครื่องมือที่กล่าวถึงข้างต้น การวิเคราะห์บันทึกสามารถช่วยให้เราไปได้ไกล

ทำความเข้าใจไฟล์บันทึก

ไฟล์บันทึกคืออะไร? บันทึกเป็นไฟล์ประเภทหนึ่งที่มีภารกิจหลักคือการจัดเก็บประวัติเหตุการณ์

เรากำลังพูดถึงเหตุการณ์แบบไหน? โดยพื้นฐานแล้ว 'เหตุการณ์' คือผู้เข้าชมและหุ่นยนต์ที่เข้าถึงไซต์ของคุณทุกวัน

Google Search Console ยังสามารถรวบรวมข้อมูลนี้ได้ แต่ด้วยเหตุผลหลายประการ โดยเฉพาะอย่างยิ่ง เหตุผลด้านความเป็นส่วนตัว จึงใช้ตัวกรองที่เฉพาะเจาะจงมาก

(ที่มา : https://support.google.com/webmasters/answer/7576553 “ความแตกต่างระหว่าง Search Console และเครื่องมืออื่นๆ”)

ดังนั้น คุณจะมีเฉพาะตัวอย่างที่การวิเคราะห์บันทึกสามารถให้ได้ ด้วยล็อกไฟล์ คุณสามารถเข้าถึงข้อมูลได้ 100%!

การวิเคราะห์บรรทัดของไฟล์บันทึกสามารถช่วยให้คุณจัดลำดับความสำคัญของการดำเนินการในอนาคตได้

ต่อไปนี้คือตัวอย่างบางส่วนของการเข้าชมไซต์ Oncrawl ที่ผ่านมาจากโรบ็อตต่างๆ:

เฟสบุ๊ค:

66.220.149.10 www.oncrawl.com - [07/Feb/2022:00:18:35 +0000] "GET /feed/ HTTP/1.0" 200 298008 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)"

เซมรัช:

185.191.171.20 fr.oncrawl.com - [13/Feb/2022:00:18:27 +0000] "GET /infographie/mises-jour-2017-algorithme-google/ HTTP/1.0" 200 50441 "-" "Mozilla/5.0 (compatible; SemrushBot/7~bl; +http://www.semrush.com/bot.html)"

บิง:

207.46.13.188 www.oncrawl.com - [22/Jan/2022:00:18:40 +0000] "GET /wp-content/uploads/2018/04/url-detail-word-count.png HTTP/1.0" 200 156829 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

GOOGLE บอท:

66.249.64.6 www.oncrawl.com - [21/Jan/2022:00:19:12 +0000] "GET /product-updates/introducing-search-console-integration-skyrocket-organic-search/ HTTP/1.0" 200 73497 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

โปรดทราบว่าการเข้าชมบอทบางส่วนอาจเป็นของปลอม สิ่งสำคัญคือต้องไม่ลืมที่จะตรวจสอบที่อยู่ IP เพื่อดูว่าเป็นการเข้าชมจริงจาก Googlebot, Bingbot และอื่นๆ หรือไม่ เบื้องหลังตัวแทนผู้ใช้ปลอมเหล่านี้ อาจมีผู้เชี่ยวชาญที่บางครั้งเปิดตัวหุ่นยนต์เพื่อเข้าถึงไซต์ของคุณ และตรวจสอบราคา เนื้อหาของคุณ หรืออื่นๆ ข้อมูลที่เป็นประโยชน์ เพื่อที่จะจดจำพวกเขา มีเพียง IP เท่านั้นที่จะเป็นประโยชน์!

ต่อไปนี้คือตัวอย่างบางส่วนของการเข้าชมไซต์ Oncrawl โดยผู้ใช้อินเทอร์เน็ต:

จาก Google.com:

41.73.11x.xxx fr.oncrawl.com - [13/Feb/2022:00:25:29 +0000] "GET /seo-technique/predire-trafic-seo-prophet-python/ HTTP/1.0" 200 57768 "https://www.google.com/" "Mozilla/5.0 (Linux; Android 10; Orange Sanza touch) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.98 Mobile Safari/537.36"

จาก Google Ads UTM:

199.223.xxx.x www.oncrawl.com - [11/Feb/2022:15:18:30 +0000] "GET /?utm_source=sea&utm_medium=google-ads&utm_campaign=brand&gclid=EAIaIQobChMIhJ3Aofn39QIVgoyGCh332QYYEAAYASAAEgLrCvD_BwE HTTP/1.0" 200 50423 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36"

จาก LinkedIn ขอบคุณผู้อ้างอิง:

181.23.1xx.xxx www.oncrawl.com - [14/Feb/2022:03:54:14 +0000] "GET /wp-content/uploads/2021/07/The-SUPER-SEO-Game-Building-an-NLP-pipeline-with-BigQuery-and-Data-Studio.pdf HTTP/1.0" 200 3319668 "https://www.linkedin.com/"

[Ebook] สี่กรณีการใช้งานเพื่อใช้ประโยชน์จากการวิเคราะห์บันทึก SEO

เรียนรู้ว่าไฟล์บันทึกเป็นข้อมูลอ้างอิงที่เชื่อถือได้เพียงรายการเดียวสำหรับการเข้าชมเว็บไซต์ สามารถให้คำตอบง่ายๆ สำหรับคำถาม SEO ที่ยากลำบากได้อย่างไร
ดาวน์โหลดฟรี

เหตุใดจึงต้องวิเคราะห์เนื้อหาบันทึก

ตอนนี้เรารู้แล้วว่าบันทึกจริงมีอะไรบ้าง เราสามารถทำอะไรกับมันได้บ้าง คำตอบ: วิเคราะห์ เช่นเดียวกับเครื่องมือวิเคราะห์อื่นๆ

บอทหรือหุ่นยนต์

ที่นี่เราสามารถถามตัวเองด้วยคำถามต่อไปนี้:

โรบ็อตตัวใดที่ใช้เวลามากที่สุดบนเว็บไซต์ของฉัน

หากเราเน้นที่เสิร์ชเอ็นจิ้นด้วยมุมมองโดยละเอียดของบอทแต่ละตัว นี่คือสิ่งที่เราเห็น:

ที่มา : Oncrawl application

เห็นได้ชัดว่า Google Mobile และ Desktop ใช้เวลาในการรวบรวมข้อมูลมากกว่าบ็อต Bing หรือ Yandex Googlebot มีส่วนแบ่งการตลาดทั่วโลกมากกว่า 90%

หาก Google รวบรวมข้อมูลหน้าเว็บของฉัน จะมีการจัดทำดัชนีโดยอัตโนมัติหรือไม่ ไม่ ไม่จำเป็น

หากเราย้อนกลับไปสองสามปี Google ใช้ระบบสะท้อนกลับอัตโนมัติเพื่อจัดทำดัชนีหน้าโดยตรงหลังจากเยี่ยมชม ทุกวันนี้ นี่ไม่ใช่กรณีอีกต่อไปแล้วเนื่องจากปริมาณของหน้าที่ต้องดำเนินการ เป็นผลให้การต่อสู้ SEO เกิดขึ้นในส่วนที่เกี่ยวกับงบประมาณการรวบรวมข้อมูล

จากทั้งหมดที่กล่าวมา คุณอาจถามว่า: อะไรคือประเด็นของการรู้ว่าบอทตัวใดใช้เวลามากกว่าตัวอื่นบนไซต์ของฉัน

คำตอบสำหรับคำถามนั้นทั้งหมดขึ้นอยู่กับอัลกอริธึมของบอทแต่ละตัว พวกเขาแต่ละคนแตกต่างกันเล็กน้อยและไม่จำเป็นต้องกลับมาด้วยเหตุผลเดียวกัน

เครื่องมือค้นหาแต่ละรายการมีงบประมาณการรวบรวมข้อมูลของตัวเองซึ่งแบ่งระหว่างบอทเหล่านี้ กล่าวอีกนัยหนึ่ง นั่นหมายความว่า Google แบ่งงบประมาณการรวบรวมข้อมูลออกจากบ็อตเหล่านี้ทั้งหมด ดังนั้นจึงค่อนข้างน่าสนใจที่จะมองให้ลึกขึ้นว่า GooglebotAds ทำอะไรได้บ้าง โดยเฉพาะอย่างยิ่งถ้าเรามี 404 อยู่รอบๆ การทำความสะอาดเป็นวิธีเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลและ SEO ของคุณในที่สุด

ตัววิเคราะห์บันทึกการรวบรวมข้อมูล

การวิเคราะห์ไฟล์บันทึกสำหรับการตรวจสอบบอทและการปรับงบประมาณการตระเวนให้เหมาะสม ตรวจหาปัญหาความสมบูรณ์ของไซต์และปรับปรุงความถี่ในการรวบรวมข้อมูลของคุณ
เรียนรู้เพิ่มเติม

การอ้างอิงโยงข้อมูล Googlebot ด้วยข้อมูล Oncrawl Crawler

เพื่อเจาะลึกลงไปในการวิเคราะห์พฤติกรรมของ Googlebot การอ้างอิงโยง Oncrawl จะบันทึกข้อมูลด้วยข้อมูลการรวบรวมข้อมูลเพื่อให้ได้ข้อมูลที่แม่นยำและละเอียดที่สุด

เป้าหมายคือเพื่อยืนยันหรือหักล้างสมมติฐานที่เชื่อมโยงกับ KPI ต่างๆ เช่น ความลึก เนื้อหา ประสิทธิภาพ ฯลฯ

ดังนั้น คุณต้องถามตัวเองด้วยคำถามที่ถูกต้อง:

  • Googlebot รวบรวมข้อมูลทุกหน้าในไซต์ของคุณหรือไม่ ให้ความสนใจในอัตราส่วนการรวบรวมข้อมูลซึ่งให้ข้อมูลนี้อย่างชัดเจน ซึ่งคุณสามารถกรองด้วยการแบ่งกลุ่มหน้าเว็บของคุณ

ที่มา : Oncrawl application

  • Googlebot ใช้เวลากับหมวดหมู่ใด นี่เป็นการใช้งบประมาณการรวบรวมข้อมูลอย่างเหมาะสมที่สุดหรือไม่ กราฟนี้ในรายงานผลกระทบ SEO ของ Oncrawl จะอ้างอิงข้อมูลและให้ข้อมูลนี้แก่คุณ

ที่มา : Oncrawl application

  • เราอาจมีคำถามนอกขอบเขตของสิ่งที่รายงานการรวบรวมข้อมูล Oncrawl เป็นค่าเริ่มต้น ตัวอย่างเช่น ความยาวของคำอธิบายมีผลกระทบต่อพฤติกรรมของ Googlebot หรือไม่ เรามีข้อมูลเกี่ยวกับสิ่งนี้จากการรวบรวมข้อมูล ดังนั้นเราจึงสามารถใช้เพื่อสร้างการแบ่งส่วนได้ดังนี้:

ที่มา : Oncrawl application

คำอธิบายที่สั้นเกินไปจะถูกรวบรวมข้อมูลน้อยกว่าคำอธิบายที่มีขนาดในอุดมคติที่กำหนดว่า "สมบูรณ์แบบ" หรือ "ดี" โดยแอปพลิเคชัน Oncrawl (ระหว่าง 110 ถึง 169 อักขระ)

หากคำอธิบายตรงตามเกณฑ์ของความเกี่ยวข้องและขนาด Googlebot จะเพิ่มงบประมาณการรวบรวมข้อมูลในหน้าที่เกี่ยวข้องอย่างมีความสุข

หมายเหตุ: หน้าที่ถือว่ายาวเกินไปในบางครั้ง Google จะเขียนใหม่

วิเคราะห์การเยี่ยมชมเว็บไซต์โดยใช้บันทึก

ต่อไป หากเราดูตัวอย่าง SEO เนื่องจากนี่คือสิ่งที่เรากำลังพยายามวิเคราะห์ด้วย Oncrawl เราขอแนะนำให้คุณถามตัวเองอีกคำถามหนึ่ง:

  • พฤติกรรมของ Googlebot กับการเข้าชม SEO มีความสัมพันธ์กันอย่างไร

Oncrawl มีกราฟเดียวกันเพื่ออ้างอิงโยงข้อมูลระหว่างการรวบรวมข้อมูลและการเข้าชม SEO ที่ดึงมาในบันทึก

ที่มา : Oncrawl application

คำตอบนั้นชัดเจนมาก: หน้าที่มีความยาวคำอธิบายที่ "สมบูรณ์แบบ" คือหน้าที่ดูเหมือนจะสร้างการเข้าชม SEO ได้มากที่สุด ดังนั้นเราจึงต้องมุ่งความสนใจไปที่แกนนี้ นอกเหนือจาก "การป้อน" Googlebot แล้ว ผู้ใช้ดูเหมือนจะชื่นชมความเกี่ยวข้องของคำอธิบาย

แอป Oncrawl ให้ข้อมูลที่คล้ายกันสำหรับ KPI อื่นๆ อีกมากมาย อย่าลังเลที่จะตรวจสอบสมมติฐานของคุณ!

สรุปแล้ว

ตอนนี้ คุณรู้และเข้าใจความเป็นไปได้ของการสำรวจสิ่งที่เกิดขึ้นบนไซต์ของคุณทุกวันด้วยบันทึกแล้ว เราขอแนะนำให้คุณวิเคราะห์ผู้ใช้อินเทอร์เน็ตและการเข้าชมของโรบ็อต เพื่อหาวิธีต่างๆ ในการเพิ่มประสิทธิภาพไซต์ของคุณ คำตอบอาจเป็นเรื่องทางเทคนิคหรือเกี่ยวกับเนื้อหา แต่จำไว้ว่าการแบ่งส่วนที่ดีคือกุญแจสู่การวิเคราะห์ที่ดี

อย่างไรก็ตาม การวิเคราะห์ประเภทนี้ไม่สามารถทำได้ด้วยเครื่องมือ Google Analytics บางครั้งข้อมูลของพวกเขาอาจสับสนกับข้อมูลของโปรแกรมรวบรวมข้อมูลของเรา การมีข้อมูลให้มากที่สุดเท่าที่จะทำได้ก็เป็นทางออกที่ดีเช่นกัน

หากต้องการใช้ประโยชน์จากข้อมูลบันทึกและการวิเคราะห์การรวบรวมข้อมูลให้มากขึ้น อย่าลังเลที่จะดูการศึกษาที่ดำเนินการโดยทีม Oncrawl ที่รวบรวม 5 SEO KPI ที่เกี่ยวข้องกับบันทึกบนเว็บไซต์อีคอมเมิร์ซ