5 ميزات Oncrawl الأكثر تقديراً
نشرت: 2021-10-20هل أنت Oncrawler المخضرم الذي يعتقد أنه يعرف النظام الأساسي مثل ظهر يده؟ أو ، هل اشتركت معنا مؤخرًا وتبحث عن نصائح داخلية لبدء العمل؟ بصفتي جزءًا من فريق CSM في Oncrawl ، لدي وجهة نظر معينة حول أدوات النظام الأساسي التي لاحظت أنها تتم زيارتها بشكل أقل تكرارًا. لذا ، بغض النظر عن موقفك ، إليك تقرير حول أفضل 5 ميزات Oncrawl الخاصة بي التي تم التقليل من شأنها والتي ربما تكون قد أغفلتها أو أنك لا تعرف عنها بعد!
الحقول المخصصة (كشط البيانات)
تلخيص سريع للحقول المخصصة في Oncrawl ، نقدم طريقتين للكشط ، XPath و Regex. وقبل المضي قدمًا ، إذا كنت بحاجة إلى نظرة أعمق في تجريف الويب ، واستخراج البيانات من مواقع الويب ، فراجع هذه المقالة التي تتناول وظائفها المفيدة.
الآن قد لا تكون الميزات الميدانية المخصصة بالضرورة رائدة ، ولكن الأمر الملائم بشكل لا يصدق هو القدرة على استخدام مزيج من كل من Regex و XPath بدلاً من الاقتصار على طريقة واحدة.
لقول ذلك ببساطة ، Regex و Xpath هما طريقتان للعثور على الأشياء. بدلاً من إجراء عمليات بحث فردية عن نص ، يمكنك إجراء بحث بناءً على نمط معين. لنفترض أنك تريد تحديد الشهر في هذا النص ، "21 سبتمبر" ، بدلاً من البحث عن "سبتمبر" ، باستخدام Regex يمكنك استخدام \ w + لالتقاط حرف الكلمة. بينما يتيح لك Xpath عرض عناصر نصية من مستند XML أو HTML. في هذه الحالة ، لنفترض أنك تريد عرض المحتوى داخل عنصر div ، فستبدأ بـ // div [class وما إلى ذلك. في بعض الحالات ، تريد فقط عرض المحتوى ، وفي حالات أخرى تريد تحديد نمط معين ، لكن في بعض الأحيان تحتاج إلى مزيج من الاثنين.
على سبيل المثال ، لنفترض أنني أريد كشط سعر جميع عناصر المنتج على الموقع. في قاعدتي الأولى ، أستخدم XPath ويمكنك أن ترى أنني أسحب البيانات الأولية للتحقق من أنني أحصل على عنصر التسعير:
بعد ذلك ، أستخدم Regex لقاعدتي الثانية لالتقاط أي عنصر فقط حتى علامة الاقتباس ، في هذه الحالة ، السعر: content = ”([^ \”] +):
يجعل إنشاء قواعد التجريف أسرع قليلاً وأسهل. وإذا لم تكن مرتاحًا لأي من الطريقتين ، فلدينا مقال لطيف هنا مع بعض النصائح.
عوامل التصفية المخصصة في مستكشف البيانات
هل سبق لك أن وجدت نفسك في Data Explorer تحاول تذكر عوامل التصفية التي استخدمتها مع لغة استعلام Oncrawl؟ أو ربما في كل مرة تكون هناك دائمًا تستخدم OQL يدويًا للتصفية من خلال الصفحات التي تم الزحف إليها وإضافة كل عمود ذي صلة واحدًا تلو الآخر. حسنًا ، يمكنك توفير بعض الوقت الثمين على نفسك باستخدام ميزة عوامل التصفية المخصصة ، والتي تقع في مكان ملائم على يمين خيارات DataSet:
لديك خيار Quickfilters الذي يتكون من استعلامات شائعة ، وستتم إضافة كل مرشح مخصص تقوم بحفظه ضمن قسم "عوامل التصفية الخاصة" حيث يمكنك بسهولة استرداد الصفحات التي تبحث عنها. يمكن القيام بذلك لكل مجموعة بيانات متاحة لك ، بشكل افتراضي سيكون لديك صفحات وروابط ، ولكن إذا قمت بتمكين مراقبة السجل في اشتراكك ، فسترى خيار مراقبة السجلات: مراقبة الصفحات والسجلات: الأحداث.
كل ما عليك فعله هو استخدام OQL لتصفية الصفحات ، وهنا ننظر إلى صفحات SEO النشطة ليوم 18 أغسطس ، وتحديدًا لمجموعة صفحات المدونة:
وبعد ذلك يمكنك استخدام القائمة المنسدلة ("إضافة أعمدة") لإضافة المقاييس ذات الصلة إلى بحثك:
ثم انقر فوق "حفظ عوامل التصفية" لحفظ الفلتر المخصص الخاص بك وسيكون متاحًا ضمن "عوامل التصفية الخاصة"
سجل التنبيه / الإخطارات
من الإضافات الحديثة إلى ترقيات الميزات الخاصة بنا لعام 2021 والتي يمكن التغاضي عنها خيار تمكين تنبيه السجل - إنها طريقة رائعة لتكون على دراية بأي مشكلات معالجة تتعلق بسجلاتك. لذا ، بدلاً من الانتظار لاكتشاف أي مشكلة تتعلق بأي ودائع عند تسجيل الدخول إلى النظام الأساسي ، قم بتمكين تنبيه السجل لإعلامك عندما لم يتم إيداع السجلات مؤخرًا ، أو أن ما تم إيداعه لا يعتبر مفيدًا.
من السهل جدًا استخدامه ، توجه إلى مشروعك الذي تم تمكين مراقبة السجل فيه وانقر على علامة التبويب "أدوات مدير السجل":
بمجرد دخولك إلى تقرير أدوات مدير السجل ، ستنقر على "تكوين الإشعارات":
من هنا ستكون قادرًا على تمكين الإخطارات وتحديد حد للوقت الذي يجب أن يتم فيه الاتصال بك إذا لم يتم إيداع أي خطوط مفيدة أو لم يتم إيداع ملفات جديدة.
يمكن أن يكون هذا توفيرًا للوقت في اكتشاف الخطأ الذي حدث بالضبط في بعض الإيداعات ، مما يجعلك أقرب كثيرًا إلى الحصول على تقارير محدثة في وقت أقرب.
[كتاب إلكتروني] أربع حالات استخدام للاستفادة من تحليل سجل تحسين محركات البحث
أدوات مدير السجل
نظرًا لأننا نتحدث عن موضوع السجلات ، يبدو من المناسب أن نذكر أن تقرير Log Manager Tools يعد مجالًا رائعًا آخر للنظام الأساسي لا يتم استخدامه في كثير من الأحيان بقدر الإمكان. إنه مركز صغير لطيف مطوي بعيدًا في مستوى المشروع والذي يتكون من تفاصيل حول ما يتم إيداعه بالضبط ، فيما يتعلق بملفات السجل.
عندما تقفز ، لن ترى فقط الملفات التي تم إيداعها بالضبط ، بل سترى التاريخ والوقت الدقيق لكل إيداع ، وتفصيل كل نوع من أنواع سطر السجل (موافق ، مصفى ، خاطئ) ، رسم بياني يراقب مقدار زيارات الروبوت المزيفة المكتشفة في كل تاريخ إيداع ، ويمكنك رؤية تفصيل لجودة السجلات المودعة وتوزيع الأسطر المفيدة.
إنه مكان رائع للتحقق من جودة إيداعات الملفات ، على سبيل المثال ، التأكد من ضغط الملفات ، إذا كنت تقوم بالفعل بالإيداع هي سطور مرتبطة بمُحسنات محركات البحث ، كما هو الحال في الزيارات العضوية ونتائج الروبوت ، والتحقق من تكرار الإيداعات.
إذا بدأت في ملاحظة أي شيء غريب في تقارير السجل ، فإن مكانًا رائعًا لبدء التحقيق هو في أدوات مدير السجل. قد تكتشف أن تنسيق سطر السجل قد تغير وأن فريق نجاح العملاء لدينا بحاجة إلى تحديث المحلل اللغوي ، أو ربما ستلاحظ أن اسم الحاوية قد تغير وتحتاج إلى إرسال بيانات اعتماد جديدة إلينا. على أي حال ، يمكنك دائمًا إلقاء نظرة والتواصل معنا إذا كنت بحاجة إلى مساعدة في التعمق أكثر.
تقسيمات شخصية
أخيرًا وليس آخرًا ، أحدث إضافة إلى ترسانتنا ، الشرائح المخصصة! لدينا الآن مجموعة من قوالب التجزئة لإلهام أولئك الجدد في Oncrawl الذين لم يسبق لهم العمل على التجزئة ، أو لجعل تطوير أحدها أكثر سلاسة.
تشغيل سريع على التقسيمات ، فهي ضرورية للتطوير لأنك تريد معرفة أي جزء من الموقع الذي تبحث عنه عند فحص نتائج الزحف. يمكن أن تكون بسيطة مثل تجميع الصفحات حسب المسار الأول في عنوان URL ، أو يمكن أن تكون محددة مثل تجميع الصفحات حسب مجموعة من جلسات GA.
بالإضافة إلى القوالب التي تمنحك الآن القليل من الإرشادات حول سبب استخدامك لها ، سيكون لديك أيضًا قوالب متعددة متاحة وفقًا لموصلات البيانات الخارجية التي قمت بإعدادها للمشروع.
لذلك إذا كانت لديك بيانات سجل ، فسيكون لديك اقتراح نموذج لزيارات تحسين محركات البحث أو نتائج الروبوت ، وإذا كان لديك Google Search Console متصل ، فسترى خيار إنشاء تقسيم بناءً على المواضع أو صفحات الترتيب.
الأمر متروك لك بشأن الطريقة التي تريد بها عرض الموقع ، فنحن هنا لنجعله أسهل قليلاً. فهيا ، أعطها فرصة وأخبرنا برأيك.