5 أسباب رائعة لدمج بيانات الزحف والسجلات

نشرت: 2018-03-27

لقد زاد فهم بيانات ملفات السجل في تحسين محركات البحث بشكل متزايد في مجتمع تحسين محركات البحث. ملفات السجل هي في الواقع التمثيل النوعي الوحيد لما يحدث على موقع الويب. لكننا ما زلنا بحاجة إلى أن نكون قادرين على جعلهم يتحدثون بشكل فعال.

توجد زيارات SEO الدقيقة وسلوك الروبوتات في ملفات السجل الخاصة بك. من ناحية أخرى ، يمكن أن توفر البيانات الواردة في تقرير الزحف معرفة جيدة بأدائك في الموقع. تحتاج إلى دمج ملفات السجل الخاصة بك وبيانات الزحف لإبراز أبعاد جديدة عند تحليل موقع الويب الخاص بك.

ستعرض لك هذه المقالة خمس طرق ممتازة لدمج بيانات ملفات السجل والزحف. من الواضح أن هناك الكثير الذي يمكنك استخدامه.

1 # الكشف عن الصفحات اليتيمة وتحسين ميزانية الزحف

ما هي الصفحة اليتيمة؟ إذا ظهر عنوان URL في السجلات دون أن يكون في بنية الموقع ، فإن عنوان URL هذا يسمى معزول.

جوجل لديها فهرس هائل! بمرور الوقت ، سيحتفظ بجميع عناوين URL التي اكتشفها بالفعل على موقع الويب الخاص بك ، حتى لو لم تعد موجودة في البنية (تغيير سبيكة ، أو صفحات محذوفة ، أو ترحيل موقع كامل ، أو روابط خارجية خاطئة أو محولة). من الواضح أن السماح لـ Google بالزحف إلى هذه الصفحات المعزولة المزعومة يمكن أن يكون له تأثير على تحسين ميزانية الزحف الخاصة بك. إذا كانت عناوين URL القديمة تستهلك ميزانية الزحف الخاصة بك ، فإن هذا يمنع الزحف إلى عناوين URL الأخرى بشكل أكثر انتظامًا وسيكون بالضرورة تأثير على مُحسّنات محرّكات البحث لديك.

عند الزحف إلى موقع الويب الخاص بك ، يتصفح OnCrawl جميع الروابط لاكتشاف ، العمق بالعمق ، البنية الكاملة لموقعك. من ناحية أخرى ، أثناء مراقبة ملفات السجل ، يجمع OnCrawl البيانات من زيارات روبوتات Google وزيارات تحسين محركات البحث.

يمكن أن يكون الاختلاف بين عناوين URL المعروفة بواسطة Google وتلك المرتبطة في البنية أمرًا مهمًا للغاية. تعد تحسينات تحسين محركات البحث (SEO) التي تهدف إلى تصحيح الروابط المنسية أو المعطلة وتقليل الصفحات المعزولة ضرورية.

ملخص-الأيتام-عند الزحف

تقرير تأثير OnCrawl SEO استنادًا إلى السجلات وتحليل البيانات المتقاطعة الزحف

توفر لقطة الشاشة أعلاه حالة من فن سجلاتك وبيانات الزحف. يمكنك ملاحظة ما يلي بسرعة:

  • يوجد 25990 صفحة في الهيكل - تم العثور عليها بواسطة الزاحف الخاص بنا مع مراعاة جميع الروابط التي اتبعتها على الموقع ؛
  • تم الزحف إلى 73.058 صفحة بواسطة Google - وهذا يزيد بثلاث مرات عن الهيكل ؛
  • نسبة الزحف 84٪ - (OnCrawl الزحف الصفحات + الصفحات النشطة من السجلات + صفحات Google التي تم الزحف إليها) / صفحات Google التي تم الزحف إليها ؛
  • لم يتم الزحف إلى أكثر من 6٪ من الصفحات الداخلية - ما عليك سوى النقر فوق الحاوية السوداء للحصول على قائمة بهذه الصفحات في مستكشف البيانات ؛
  • 60 ألف صفحة يتيمة - الدلتا بين الصفحات في الهيكل والصفحات التي تم الزحف إليها بواسطة Google ؛
  • 34 ألف زيارة لتحسين محركات البحث على هذه الصفحات - يبدو أن هناك مشكلة في الارتباط الداخلي!

أفضل ممارسة: يمنحك OnCrawl ميزة استكشاف البيانات وراء كل رسم بياني أو مقياس فقط بالنقر فوقه. بهذه الطريقة ، ستحصل على قائمة قابلة للتنزيل من عناوين URL التي تمت تصفيتها مباشرة على النطاق الذي كنت تستكشفه.

2 # اكتشف عناوين URL التي تستهلك معظم (أو أقل) ميزانية الزحف

جميع الأحداث من زيارات روبوتات Google معروفة من خلال منصة بيانات OnCrawl. يتيح لك ذلك معرفة - لكل عنوان URL - جميع البيانات المجمعة وفقًا للوقت.
في مستكشف البيانات ، يمكنك إضافة أعمدة نتائج كل برنامج تتبع لعنوان URL (على مدار 45 يومًا) والنتائج حسب اليوم وعن طريق برامج الروبوت ، وهي متوسط ​​القيمة لكل يوم. هذه المعلومات ذات قيمة لتقييم استهلاك ميزانية الزحف جوجل. ستجد غالبًا أن هذه الميزانية ليست موحدة في جميع المواقع.

url-crawl-budget

قائمة بجميع عناوين URL من Data Explorer مع مقاييس الزحف وتصفيتها حسب نتائج الروبوت حسب اليوم

في الواقع ، يمكن لبعض العوامل تشغيل ميزانية الزحف أو تقليلها. ثم أنشأنا قائمة بأهم المقاييس في هذه المقالة حول أهمية صفحة Google. العمق ، عدد الروابط التي تشير إلى الصفحة ، عدد الكلمات الرئيسية ، سرعة الصفحة ، InRank (الشعبية الداخلية) تؤثر على زحف الروبوتات. سوف تتعلم المزيد في الفقرة التالية.

3 # تعرف على أفضل صفحات تحسين محركات البحث لديك ، وأسوأ صفحات تحسين محركات البحث لديك وحدد عوامل نجاح الصفحات

عند استخدام مستكشف البيانات ، يمكنك الوصول إلى المقاييس الرئيسية حول الصفحات - ولكن قد يكون من الصعب مقارنة مئات الأسطر والمقاييس معًا. يعد استخدام الأعمدة لتقسيم نتائج الروبوتات حسب اليوم وزيارات تحسين محركات البحث يوميًا حليفًا في التنقيب عن البيانات.

  • تنزيل CS - Bot Hits by Day وزيارات CS - SEO حسب ملفات JSON اليومية ؛
  • أضفهم كتقسيمات جديدة.

في الواقع ، يمكنك إنشاء أقسام استنادًا إلى هاتين القيمتين الناتجتين عن تحليل السجل للحصول على أول توزيع لصفحاتك حسب المجموعات. ولكن يمكنك أيضًا التصفية من خلال كل مجموعة من هذه التقسيمات لاكتشاف سريع - في كل تقرير OnCrawl - الصفحات التي لا تصل إلى القيم المتوقعة.

في الصفحة الرئيسية لمشروعك ، انقر على زر "تكوين التقسيم".

تكوين التجزئة

ثم قم بإنشاء تجزئة جديدة

خلق التجزئة

استخدم استيراد JSON عن طريق اختيار سعة "استخدام JSON" وانسخ / الصق الملفات التي قمت بتنزيلها.

تحميل- json

يمكنك الآن تبديل الأقسام باستخدام القائمة العلوية في كل تقرير.

التبديل التجزئة

تغيير التقسيم المباشر في جميع تقارير OnCrawl

سيعطيك هذا في كل رسم تأثير المقاييس التي تقوم بتحليلها والمرتبطة بالصفحات المجمعة حسب نتائج الروبوت أو زيارات تحسين محركات البحث.

في المثال التالي ، استخدمنا هذه المقاطع لفهم تأثير شعبية InRank الداخلية - استنادًا إلى قوة الروابط حسب العمق. علاوة على ذلك ، ترتبط زيارات الروبوتات وزيارات تحسين محركات البحث على نفس المحور.

توزيع inrank-Hits-day

توزيع InRank حسب نتائج الروبوت حسب اليوم

توزيع InRank-SEO-visit-day

توزيع InRank عن طريق زيارات تحسين محركات البحث حسب اليوم

من الواضح أن العمق (عدد النقرات من الصفحة الرئيسية) له تأثير على كل من زيارات الروبوتات وزيارات تحسين محركات البحث.

بالطريقة نفسها ، يمكن تحديد كل مجموعة صفحات بشكل مستقل لتمييز البيانات من الصفحات الأكثر زيارة أو زيارة.

يسمح هذا بالكشف السريع عن الصفحات التي يمكن أن تؤدي بشكل أفضل إذا تم تحسينها ، أو عدد الكلمات في الصفحة ، أو عمق أو عدد الروابط الواردة على سبيل المثال.

ما عليك سوى اختيار التقسيم الصحيح ومجموعة الصفحات التي تريد تحليلها.

توزيع الكلمات-بوت-الزيارات

توزيع الكلمات في الصفحة للمجموعة التي تحتوي على 0 bot ضرب باليوم

4 # تحديد قيم العتبة لتعظيم ميزانية الزحف وزيارات تحسين محركات البحث

للمضي قدمًا ، يمكن لتقرير تأثير تحسين محركات البحث - الزحف إلى تحليل البيانات المتقاطعة وتسجيلها - اكتشاف قيم العتبة التي تساعد على زيادة زيارات تحسين محركات البحث أو تكرار الزحف أو اكتشاف الصفحات.

تأثير عدد الكلمات على وتيرة الزحف

الزحف التردد عدد الكلمات

تردد الزحف بعدد الكلمات

نلاحظ أن معدل تكرار الزحف يتضاعف عندما يتجاوز عدد الكلمات 800. ثم يتضاعف أيضًا عندما يتجاوز عدد الكلمات في الصفحة 1200 كلمة.

تأثير عدد الروابط الداخلية على نسبة الزحف

تردد الزحف الداخلي

نسبة الزحف من خلال عدد الروابط الداخلية في جميع أنحاء الموقع

ارتباطات نسبة الزحف إلى الرقم

نسبة الزحف من خلال عدد الروابط الداخلية في أجزاء معينة من موقع الويب (صفحات البحث)

تأثير العمق على فعالية الصفحات

توليد الصفحات- SEO- الزيارات

الصفحات التي تنشئ زيارات لتحسين محركات البحث (أو لا) حسب العمق

يمكنك أن ترى أن وجود مقاييس الموقع الصحيحة أثناء الزحف وبيانات سجلات العبور يسمح لك على الفور باكتشاف تحسينات تحسين محركات البحث المطلوبة لمعالجة زحف Google وتحسين زيارات تحسين محركات البحث.

5 # تحديد كيف تؤثر عوامل الترتيب SEO على معدل الزحف الخاص بك

تخيل لو كان بإمكانك معرفة القيم التي يجب استهدافها لتحقيق أقصى قدر من مُحسّنات محرّكات البحث الخاصة بك؟ هذا هو الغرض من تحليل البيانات المتقاطعة! يسمح لك بالتحديد الدقيق ، لكل مقياس ، حيث يتم تعظيم الحد الأقصى لتكرار الزحف أو معدل الزحف أو النشاط.

لقد رأينا أعلاه - في المثال المتعلق بعدد الكلمات في كل صفحة وتكرار الزحف - أن هناك قيمًا مشغلة لتكرار الزحف. يجب تحليل هذه الفجوات ومقارنتها لكل نوع من الصفحات لأننا نبحث عن طفرات في سلوك الروبوتات أو زيارات تحسين محركات البحث.

مثل تلك المعروضة أدناه:

نطاق التردد الزحف

تردد الزحف به فجوة في أكثر من 100 رابط

الزحف تردد التحميل الوقت

معدل الزحف أفضل في الصفحات السريعة

زيارات inrank-SEO

الفجوة الأولى في زيارات تحسين محركات البحث موجودة على InRank 5،75 ، والأفضل على InRank 10 (الصفحة الرئيسية)

يتيح لك الجمع بين بيانات الزحف والسجلات فتح صندوق Google الأسود وتحديد تأثير المقاييس الخاصة بك على زحف الروبوتات والزيارات. عند تنفيذ التحسينات الخاصة بك على هذه التحليلات ، يمكنك تحسين مُحسّنات محرّكات البحث في وقت كل إصدار من إصداراتك. هذا الاستخدام المتقدم دائم في الوقت المناسب ، حيث يمكنك اكتشاف قيم جديدة للوصول إليها في كل تحليل عبر البيانات.

أي حيل أخرى مع تحليل البيانات المتقاطعة التي ترغب في مشاركتها؟

ابدأ تجربتك المجانية