تحليل ملف السجل: البديل الذكي لبرنامج Google Analytics
نشرت: 2022-03-08هل تعلم ما يحدث على موقع الويب الخاص بك كل يوم؟ أول ما يتبادر إلى الذهن عند الإجابة على هذا السؤال هو على الأرجح استخدام أدوات تتبع السلوك والجمهور. هناك العديد من هذه الأدوات المتاحة في السوق بما في ذلك: Google Analytics و At Internet و Matomo و Fathom Analytics و Simple Analytics على سبيل المثال لا الحصر. بينما تسمح لنا هذه الأدوات بالحصول على نظرة عامة جيدة على ما يحدث في أي وقت على مواقعنا الإلكترونية ، فإن الممارسات الأخلاقية التي تستخدمها هذه الأدوات ، وبشكل أكثر تحديدًا Google Analytics ، أصبحت موضع تساؤل مرة أخرى.
يشير هذا إلى وجود مصادر أخرى للبيانات لا يتم استغلالها حاليًا بشكل كافٍ من قبل جميع مالكي مواقع الويب: السجلات.
أدوات التحليل و GDPR (التركيز على Google Analytics)
أصبحت البيانات الشخصية موضوعًا حساسًا في فرنسا منذ تطبيق اللائحة العامة لحماية البيانات (GDPR) وإنشاء اللجنة الوطنية للمعلوماتية والحرية (CNIL). أصبحت حماية البيانات أولوية.
إذن ، هل لا يزال موقع الويب الخاص بك "متوافقًا مع اللائحة العامة لحماية البيانات"؟
إذا ألقينا نظرة على جميع مواقع الويب ، فيمكننا أن نجد أن العديد قد وجدوا طريقة للالتفاف على القواعد باستخدام ملفات تعريف الارتباط الخاصة بهم (لافتات جمع البيانات) لجمع المعلومات التي يحتاجون إليها ، بينما لا يزال الآخرون يلتزمون بشدة باللوائح الرسمية.
من خلال جمع هذه المعلومات ، تسمح لنا أدوات تحليل البيانات بتحليل من أين يأتي الجمهور وسلوك الزائر. يتطلب هذا النوع من التحليل خطة وضع علامات لا تشوبها شائبة لجمع البيانات الأكثر موثوقية ودقة الممكنة ، وفي النهاية تكون البيانات التي تم جمعها نتيجة لكل إجراء وحدث على الموقع.
بعد عدد من الشكاوى ، قررت CNIL إخطار Google Analytics بجعله غير قانوني في فرنسا ، في الوقت الحالي. تأتي هذه العقوبة من النقص الواضح في الإشراف فيما يتعلق بنقل البيانات الشخصية إلى أجهزة الاستخبارات في الولايات المتحدة على الرغم من أن معلومات الزائر قد تم جمعها مسبقًا بموافقة. يجب مراقبة التطورات عن كثب.
في هذا السياق الحالي ، مع إمكانية الوصول المحدود أو عدم الوصول إلى Google Analytics ، قد يكون من المثير للاهتمام النظر في خيارات جمع البيانات الأخرى. تعد ملفات السجل مصدرًا رائعًا للمعلومات ، وهي عبارة عن مجموعة من الأحداث التاريخية للموقع وسهلة الاسترداد نسبيًا.
على الرغم من أن ملفات السجل توفر الوصول إلى أرشيف مثير للاهتمام من المعلومات لتحليلها ، فإنها لا تسمح لنا بعرض قيم العمل أو السلوك الحقيقي لزائر الموقع ، مثل التنقل في الموقع من البداية حتى الوقت الذي يتحقق فيه من سلة التسوق أو يغادر موقع. ومع ذلك ، يظل الجانب السلوكي خاصًا بالأدوات المذكورة أعلاه ؛ يمكن أن يساعدنا تحليل السجل في الوصول إلى مسافة بعيدة.
فهم ملفات السجل
ما هي ملفات السجل؟ السجلات هي نوع من الملفات تتمثل مهمتها الرئيسية في تخزين محفوظات الأحداث.
ما نوع الأحداث التي نتحدث عنها؟ بشكل أساسي ، "الأحداث" هم الزوار والروبوتات التي تصل إلى موقعك كل يوم.
يمكن لـ Google Search Console أيضًا جمع هذه المعلومات ، ولكن لعدة أسباب - على وجه الخصوص ، لأسباب تتعلق بالخصوصية - تقوم بتطبيق عامل تصفية محدد للغاية.
(المصدر: https://support.google.com/webmasters/answer/7576553. "الاختلافات بين Search Console والأدوات الأخرى".)
وبالتالي ، سيكون لديك فقط عينة مما يمكن أن يوفره تحليل السجل. باستخدام ملفات السجل ، يمكنك الوصول إلى 100٪ من البيانات!
يمكن أن يساعدك تحليل سطور ملفات السجل في تحديد أولويات إجراءاتك المستقبلية.
فيما يلي بعض الأمثلة على الزيارات السابقة إلى موقع Oncrawl من روبوتات مختلفة:
موقع التواصل الاجتماعي الفيسبوك:
66.220.149.10 www.oncrawl.com - [07/Feb/2022:00:18:35 +0000] "GET /feed/ HTTP/1.0" 200 298008 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)"
سيمروش:
185.191.171.20 fr.oncrawl.com - [13/Feb/2022:00:18:27 +0000] "GET /infographie/mises-jour-2017-algorithme-google/ HTTP/1.0" 200 50441 "-" "Mozilla/5.0 (compatible; SemrushBot/7~bl; +http://www.semrush.com/bot.html)"
بنج:
207.46.13.188 www.oncrawl.com - [22/Jan/2022:00:18:40 +0000] "GET /wp-content/uploads/2018/04/url-detail-word-count.png HTTP/1.0" 200 156829 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"
جوجل بوت:
66.249.64.6 www.oncrawl.com - [21/Jan/2022:00:19:12 +0000] "GET /product-updates/introducing-search-console-integration-skyrocket-organic-search/ HTTP/1.0" 200 73497 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
يرجى ملاحظة أن بعض زيارات الروبوت قد تكون وهمية. من المهم أن تتذكر التحقق من عناوين IP لمعرفة ما إذا كانت زيارات حقيقية من Googlebot أو Bingbot وما إلى ذلك. خلف وكلاء المستخدم المزيفين ، قد يكون هناك محترفون يطلقون أحيانًا روبوتات للوصول إلى موقعك والتحقق من الأسعار أو المحتوى الخاص بك أو غير ذلك. المعلومات التي يجدونها مفيدة. من أجل التعرف عليهم ، سيكون عنوان IP فقط مفيدًا!
فيما يلي بعض الأمثلة على زيارات موقع Oncrawl من قبل مستخدمي الإنترنت:
من Google.com:
41.73.11x.xxx fr.oncrawl.com - [13/Feb/2022:00:25:29 +0000] "GET /seo-technique/predire-trafic-seo-prophet-python/ HTTP/1.0" 200 57768 "https://www.google.com/" "Mozilla/5.0 (Linux; Android 10; Orange Sanza touch) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.98 Mobile Safari/537.36"
من إعلانات Google UTMs:
199.223.xxx.x www.oncrawl.com - [11/Feb/2022:15:18:30 +0000] "GET /?utm_source=sea&utm_medium=google-ads&utm_campaign=brand&gclid=EAIaIQobChMIhJ3Aofn39QIVgoyGCh332QYYEAAYASAAEgLrCvD_BwE HTTP/1.0" 200 50423 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36"
من LinkedIn بفضل المحيل:
181.23.1xx.xxx www.oncrawl.com - [14/Feb/2022:03:54:14 +0000] "GET /wp-content/uploads/2021/07/The-SUPER-SEO-Game-Building-an-NLP-pipeline-with-BigQuery-and-Data-Studio.pdf HTTP/1.0" 200 3319668 "https://www.linkedin.com/"
[كتاب إلكتروني] أربع حالات استخدام للاستفادة من تحليل سجل تحسين محركات البحث
لماذا تحليل محتوى السجل؟
الآن بعد أن عرفنا ما تحتويه السجلات بالفعل ، ماذا يمكننا أن نفعل بها؟ الجواب: تحليلهم ، مثل أي أداة تحليلات أخرى.
الروبوتات أو الروبوتات
وهنا نسأل أنفسنا السؤال التالي:
ما هي الروبوتات التي تقضي معظم الوقت على موقع الويب الخاص بي؟
إذا ركزنا على محركات البحث ، مع عرض تفصيلي لكل روبوت ، فإليك ما يمكننا رؤيته:
المصدر: تطبيق Oncrawl
من الواضح أن Google Mobile و Desktop يقضيان وقتًا أطول بكثير في الزحف من Bing أو Yandex bots. يمتلك Googlebot حصة سوقية عالمية تزيد عن 90٪.
إذا قام محرك بحث Google بالزحف إلى صفحاتي ، فهل تتم فهرستها تلقائيًا؟ لا ليس بالضرورة.
إذا عدنا بضع سنوات إلى الوراء ، فقد استخدم Google رد فعل تلقائي لفهرسة الصفحات مباشرة بعد زيارتهم. اليوم ، لم يعد هذا هو الحال نظرًا لحجم الصفحات التي يتعين عليها معالجتها. نتيجة لذلك ، تنشأ معركة تحسين محركات البحث فيما يتعلق بميزانية الزحف.
بعد كل ما يقال ، قد تسأل: ما الهدف من معرفة الروبوت الذي يقضي وقتًا أطول من الآخر على موقعي؟
تعتمد الإجابة على هذا السؤال جميعًا على خوارزميات كل من خوارزميات الروبوتات. كل منهما مختلف قليلاً ولا يعود بالضرورة لنفس الأسباب.
كل محرك بحث له ميزانية الزحف الخاصة به والتي يقسمها بين هذه الروبوتات . بمعنى آخر ، هذا يعني أن Google تقسم ميزانية الزحف الخاصة بها بين كل هذه الروبوتات. لذلك ، يصبح من المثير للاهتمام أن ننظر عن كثب إلى ما يفعله GooglebotAds ، خاصة إذا كان لدينا 404s. يعد تنظيفها طريقة لتحسين ميزانية الزحف وتحسين محركات البحث في النهاية.
محلل سجل الزحف
الإسناد الترافقي لبيانات Googlebot مع بيانات Oncrawl Crawler
من أجل التعمق في تحليل سلوك Googlebot ، يقوم Oncrawl بإحالة بيانات السجل مع بيانات الزحف للحصول على المعلومات الأكثر تفصيلاً ودقة.
الهدف أيضًا هو تأكيد أو دحض الفرضيات المرتبطة بالعديد من مؤشرات الأداء الرئيسية مثل العمق والمحتوى والأداء وما إلى ذلك.
وفقًا لذلك ، عليك أن تسأل نفسك الأسئلة الصحيحة:
- هل يزحف Googlebot إلى جميع الصفحات الموجودة على موقعك؟ اهتم بنسبة الزحف التي توفر بوضوح هذه المعلومات التي يمكنك أيضًا تصفيتها بتقسيم صفحاتك.
المصدر: تطبيق Oncrawl
- في أي فئة يقضي Googlebot وقته؟ هل هذا هو الاستخدام الأمثل لميزانية الزحف؟ يشير هذا الرسم البياني في تقرير تأثير تحسين محركات البحث الخاص بـ Oncrawl إلى البيانات ويعطيك هذه المعلومات.
المصدر: تطبيق Oncrawl
- قد يكون لدينا أيضًا أسئلة خارج نطاق ما يقدمه تقرير زحف Oncrawl افتراضيًا. على سبيل المثال ، هل طول الوصف له تأثير على سلوك Googlebot؟ لدينا البيانات المتعلقة بهذا بفضل الزحف ، لذا يمكننا استخدامه لإنشاء تقسيم كما هو موضح أدناه:
المصدر: تطبيق Oncrawl
يتم الزحف إلى الأوصاف القصيرة جدًا بدرجة أقل بكثير من الأوصاف ذات الحجم المثالي المعين على أنها "مثالية" أو "جيدة" هنا بواسطة تطبيق Oncrawl (بين 110 و 169 حرفًا).
إذا كان الوصف يفي بمعايير الملاءمة والحجم ، من بين أمور أخرى ، فسيسعد Googlebot بزيادة ميزانية الزحف الخاصة به على الصفحات ذات الصلة.
ملاحظة: يتم أحيانًا إعادة كتابة الصفحات التي تعتبر طويلة جدًا بواسطة Google.
تحليل زيارات الموقع باستخدام السجلات
بعد ذلك ، إذا نظرنا إلى مثال تحسين محركات البحث ، نظرًا لأن هذا هو ما نحاول تحليله باستخدام Oncrawl ، أقترح عليك أن تسأل نفسك سؤالًا آخر:
- ما العلاقة بين سلوك Googlebot وزيارات تحسين محركات البحث؟
يحتوي Oncrawl على نفس الرسوم البيانية لإسناد البيانات بين بيانات الزحف وزيارات تحسين محركات البحث التي تم استردادها في السجلات.
المصدر: تطبيق Oncrawl
الجواب واضح جدًا: الصفحات التي لها طول وصف "مثالي" هي تلك التي يبدو أنها تولد معظم زيارات تحسين محركات البحث. لذلك يجب أن نركز جهودنا على هذا المحور. بالإضافة إلى "تغذية" Googlebot ، يبدو أن المستخدمين يقدرون أهمية الوصف.
يوفر تطبيق Oncrawl بيانات مماثلة للعديد من مؤشرات الأداء الرئيسية الأخرى. لا تتردد في التحقق من فرضياتك!
ختاماً
الآن بعد أن عرفت وفهمت إمكانية استكشاف ما يحدث على موقعك كل يوم بفضل السجلات ، أشجعك على تحليل مستخدمي الإنترنت وزيارات الروبوت من أجل إيجاد طرق مختلفة لتحسين موقعك. قد تكون الإجابات تقنية أو متعلقة بالمحتوى ، لكن تذكر أن التقسيم الجيد هو مفتاح التحليل الجيد.
هذا النوع من التحليل غير ممكن باستخدام أدوات Google Analytics ، ومع ذلك ؛ يمكن أحيانًا الخلط بين بياناتهم وبيانات الزاحف الخاص بنا. يعد وجود أكبر قدر ممكن من البيانات تحت تصرفك حلاً جيدًا أيضًا.
للحصول على المزيد من بيانات السجل وتحليلات الزحف ، لا تتردد في إلقاء نظرة على دراسة أجراها فريق Oncrawl الذي يجمع 5 مؤشرات أداء رئيسية لتحسين محركات البحث تتعلق بالسجلات على مواقع التجارة الإلكترونية.