ملفات Sitemap بتنسيق XML: لماذا يعتبر تسلسل عناوين URL مهمًا حتى لو قال Google إنه غير ذلك
نشرت: 2023-02-09
هناك العديد من الأشياء التي تناقشها مُحسّنات محرّكات البحث - افعل هذا ، لا تفعل ذلك ، هذا يحدث فرقًا ولكن هذا لا يحدث.
لا أحد يعرف أسرار خوارزميات Google باستثناء Google (وأحيانًا أتساءل عما إذا كانت الخوارزمية معقدة للغاية بالنسبة للبعض في Google لمعرفة كيفية عملها).
ومع ذلك ، هناك بعض الأشياء التي تقول Google بشكل قاطع إنها لا تهم إذا فعلناها أم لا. هل هذا يعني أننا لا يجب أن نفعلها؟ لا ، لا.
في عالم مثالي ، ستؤدي مواقعنا على الويب و Google أداءً كما ينبغي تمامًا ولصالحنا. في الواقع ، يمكن أن يتحرك أي عدد من الأشياء بشكل جانبي عندما تزحف محركات البحث إلى أحد المواقع.
إذا لم يضر موقع الويب بتنفيذ شيء قد يجعل من الأفضل لمحركات البحث الزحف والفهم - وكان من السهل القيام بذلك - فلماذا لا تفعل ذلك؟
تعد خرائط مواقع XML وعلامات الأولوية وعلامات التردد المتغيرة وترتيب عناوين URL بعضًا من أساليب تحسين محركات البحث (SEO) التي تمت مناقشتها. دعونا نناقش:
- أساسيات خريطة موقع XML
- العلامات ذات الأولوية
- تغيير علامات التردد
- لذا ، هل يجب استخدام العلامات؟
- تسلسل URL
أساسيات خريطة موقع XML
ملف Sitemap بتنسيق XML هو ملف ينشئه مشرفو المواقع ويضعونه على موقعهم لإخبار محركات البحث مثل Google و Bing بالصفحات والصور ومقاطع الفيديو الموجودة على الموقع.
يعمل ملف Sitemap مثل الخريطة ، مما يساعد على ضمان الزحف والفهرسة بشكل أكثر شمولاً. ومع ذلك ، فإن خريطة موقع XML لا تضمن أن محركات البحث ستقوم بفهرسة جميع الصفحات أو الزحف إليها ، كما أن خريطة الموقع لن تؤثر على تصنيفاتك.
(راجع كتابنا التمهيدي حول خرائط مواقع XML لمزيد من المعلومات.)
هناك علامات اختيارية يرغب بعض الأشخاص في تضمينها في خريطة الموقع الخاصة بهم ، مثل علامة الأولوية وعلامة تغيير التردد. الموقف الرسمي لشركة Google هو أنها تتجاهل كليهما.
ثم هناك الممارسة أو تسلسل عنوان URL (ترتيب عناوين URL في خريطة موقعك بترتيب أولوياتك). تقول Google إنها تتجاهل هذا أيضًا.
لكن هل يجب أن نتجاهلها؟ لنتحدث بعد ذلك عن هذه الممارسات الثلاثة.
العلامات ذات الأولوية
تخبر علامة الأولوية Google عن مدى أهمية الصفحة من 1 (الأعلى) إلى 0 (الأدنى).
تنتقل قيم أولوية ملف Sitemap من 1.0 إلى 0.0 حيث تشير القيمة 1.0 إلى أهم صفحة على الموقع. تبدو قيم الأولوية على النحو التالي: 1.0 و 0.9 و 0.8 و 0.7 و 0.6 و 0.5 و 0.4 و 0.3 و 0.2 و 0.1 و 0.0. على سبيل المثال ، من المحتمل أن يكون الإصدار 1.0 هو الصفحة الرئيسية.
إذا كنت تستخدم هذه العلامة ، فهذا لا يعني أن Google سيزحف إلى الصفحات التي تعتقد أنها أكثر أهمية. الأمر متروك للخوارزمية لتحديد ما هو أكثر ملاءمة والأولوية قد لا تتطابق. يمكنك محاولة اكتشاف أي الصفحات يتم الزحف إليها أكثر من غيرها بالنظر إلى سجلات الخادم.
بشكل عام ، عند استخدام علامة الأولوية ، يمكنك تعيين قيم مثل هذه:
- 1.0 - 0.8 = صفحات الفئات ، الصفحة الرئيسية ، أهم الصفحات المقصودة
- 0.7 - 0.4 = مقالات المدونة وصفحات الفئات الثانوية وصفحات الفئات الفرعية
- 0.3 = 0.0 = الصفحات التي ليست بنفس الأهمية مثل المحتوى القديم أو صفحات نوع الأداة المساعدة
تغيير علامات التردد
تهدف علامة تردد التغيير إلى إخبار Google بعدد مرات تحديث الصفحات على موقع الويب الخاص بك. من الناحية النظرية ، ستعرضها Google وتتخذ قرارًا بشأن الزحف إلى هذه الصفحة مرة أخرى بناءً على تاريخ آخر تحديث لها.
مرة أخرى ، موقف Google الرسمي هو أنه يتجاهل تغيير علامة التردد. وقد أوضح جون مولر من Google أنه من الأفضل "تحديد الطابع الزمني مباشرةً حتى نتمكن من النظر في أنظمتنا الداخلية والقول إننا لم نزحف منذ هذا التاريخ ، وبالتالي يجب علينا الزحف مرة أخرى."
هذه العلامة بالتأكيد غير ذات صلة إذا لم تكن دقيقة. كما ذكر Mueller في الفيديو أعلاه ، "نرى الكثير من المواقع التي يقدمونها لنا هذه المعلومات في خريطة الموقع ، قالوا إنها تتغير يوميًا أو أسبوعيًا ، ونحن ننظر في قاعدة البيانات الخاصة بنا ولم تتغير في شهر أو سنوات. "
لذا ، هل يجب استخدام العلامات؟
حقيقة أن العلامات مذكورة في وثائق خريطة موقع XML من Google على الإطلاق على أنها "اختيارية" أمر محير - خاصة عندما يقولون إنهم يتجاهلونها. هل يتجاهلها Googlebot حقًا في كل مرة؟ من الصعب معرفة ذلك. من الأفضل دائمًا استخدامها ، خاصةً تواريخ المراجعة الأخيرة (<lastmod>).
أعتقد أن هناك خيارًا آخر يمكنك القيام به باستخدام خريطة الموقع للإشارة إلى الطريقة التي تريد أن تزحف إليها محركات البحث. تقول Google أيضًا إنها تتجاهل هذه الطريقة ، لكن التزم بي.
لقد رأينا بعض النجاح في الفهرسة من خلال تسلسل عناوين URL ، والذي سأتحدث عنه بعد ذلك.
تسلسل URL
تسلسل عنوان URL هو ممارسة ترتيب عناوين URL في خريطة موقعك وفقًا للأولوية - ولكن ليس بالطريقة التي تعمل بها علامة الأولوية. يتجاهل Google علامات الأولوية ، لذلك تعتقد Google أن جميع الصفحات "متساوية" وبالتالي لا يهم التسلسل ... على الأقل للأولوية. لكن الصفحات ليست متساوية في الحياة الواقعية ، خاصة إذا كان لديك ميزانيات زحف ضعيفة.
نوصي بشدة أن تقوم بتسلسل عناوين URL في خريطة موقع XML الخاصة بك بطريقة تتناول كلاً من مفهومي الأولوية وتغيير التكرار دون استخدام العلامات. الهدف هنا هو فهرسة الصفحات الرئيسية بشكل أسرع.
راجع للشغل ، استخدم فقط عناوين URL التي تتطابق مع العلامات الأساسية الموجودة في مكان ما على موقعك أو تلك الصفحات المهمة!
على سبيل المثال ، هذا تسلسل يركز على أحدث الصفحات المعدلة:
- إدخالات تم تغييرها مؤخرًا عمرها يوم واحد (أهداف إعادة توجيه جديدة ، صفحات جديدة أو منقحة) [500 إدخال لكل صفحة XML]
- مدخلات عمرها أسبوع واحد على النحو الوارد أعلاه ، أقدم قليلاً [500 إدخال لكل صفحة XML]
- 200 صفحة رموز متبقية (مرتبة تنازليًا حسب مرات الظهور) [1000 إدخال لكل صفحة]
- أي صفحات إعادة توجيه أخرى (رموز 30x) [5 كيلوبايت لكل صفحة]
- الصور ومقاطع الفيديو [500 لكل صفحة]
- 404 صفحة [10 كيلوبايت لكل صفحة]
- الباقي [10 آلاف لكل صفحة]
ما تفعله أساسًا هو تقديم خارطة طريق لمحركات البحث حول الصفحات التي تعتقد أنه يجب الزحف إليها بناءً على الحداثة. تريد أن تدخل جميع الصفحات في الفهرس وتعتقد أن الصفحات التي تم فحصها الأسبوع الماضي موجودة بالفعل - لكن الصفحات الجديدة ليست كذلك. استخدم توجيهات التسلسل أعلاه.
لماذا تهتم بفعل هذا إذا قالت Google صراحة إنها تتجاهل الأولوية والتسلسل؟
نظرًا لميزانية الزحف غير المحدودة ، والقليل من عمليات إعادة التوجيه إلى موقع الويب وعدم وجود أخطاء ، يتم الزحف إلى جميع الملفات. الأولوية والتسلسل لا يهم. جوجل محق إذا استمرت الافتراضات.
لكنهم لا يصمدون . هناك ميزانية زحف ، ويتم التخلص منها من خلال عمليات إعادة التوجيه و 404. إذا كان لديك أي شيء بخلاف الصفحة (صورة ، فيديو ، hreflang ، إلخ) ، فإن تقديرات الوقت خاطئة. رمي في أي أخطاء كبيرة ويتم تجاهل الملفات المتبقية في خريطة موقع XML.
في حين أن الأولوية والتسلسل في عالم مثالي لا يهم ، في عالم ميزانية الزحف ، فإنهم مهمون. من واقع خبرتي ، فإن تسلسل عناوين URL لمحرك البحث هو كل ما يهم.
لقد وجدنا أن هذا يزيد من عدد الصفحات التي تم فحصها ويقلل من مشكلات "تم التخلي عنها بسبب الخطأ".
افكار اخيرة
نعم ، الأمر متروك للروبوتات لتقرير كيفية التعامل مع خرائط مواقع XML. ومع ذلك ، فإن تنفيذ شيء يمكن أن يساعد محركات البحث في الزحف إلى محتوى موقع الويب الخاص بك وفهرسته - إذا كان سهلاً بدرجة كافية - ليس فكرة سيئة أبدًا.
يمكن لخبراء تحسين محركات البحث لدينا مساعدتك في تحسين موقعك بحيث يمكن الزحف إليه وفهرسته بسهولة. تواصل معنا للحصول على استشارة مجانية.