خريطة موقع XML: التوصيات الرئيسية للتحسين

نشرت: 2021-03-26

يمكن أن يكون ملف Sitemap.xml الموجود على موقعك بمثابة تنقل جيد للصفحات التي تريد أن يقوم Google bot بفهرستها. يساعدك في العثور على صفحاتك الرئيسية بشكل أسرع ، حتى إذا لم يكن لديك ارتباط داخلي جيد.

في هذه المقالة ، سنقدم توصيات متنوعة لتحسين ملف خريطة موقع XML ولماذا من الجيد القيام بذلك.

جدول المحتويات

الوظائف والمزايا

خريطة موقع XML

اجعل من السهل على الروبوتات العمل والسماح بإمكانية الحصول على "تقارير" للصفحات والروابط الموجودة على موقعك والتي لا يمكن العثور عليها بسهولة.

بعض فوائد تحسين محركات البحث هي كما يلي:

  • فهرسة أسرع - ستعثر محركات البحث على الصفحات الجديدة بشكل أسرع ، وبالتالي فإن عملية فهرسة موقع الويب وعرضه في نتائج البحث ستكون أسرع. الشيء الغريب هنا هو أنه يمكن أن يساعدك أيضًا في فك الفهرسة (مزيد من المعلومات هنا) ؛
  • فهرسة أفضل للصفحات الداخلية - يمكن لمحركات البحث العثور على الصفحات التي لم يتم العثور عليها عند الزحف إلى موقع الويب. لكن هذا لا يعني بالضرورة أنه سيتم فهرستها جميعًا.
  • مراقبة الصفحات المفهرسة. بالاشتراك مع Google Search Console ، يمكنك معرفة عناوين URL التي يتم تناولها في ملف XML Sitemap الذي يقوم Google بفهرسته.

هل خريطة موقع XML مهمة؟

من المهم بالنسبة للمواقع التي:

  • ليس لديك بنية جيدة أو ليس لديك توزيع جيد للروابط الداخلية ؛

الربط الداخلي الجيد والسيئ

  • تحتوي على العديد من الصفحات - تساعد خريطة موقع XML محركات البحث في العثور على الصفحات الجديدة أو المحدثة ؛

محرك بحث انفوجرافيك

  • ليس لديها العديد من الروابط الواردة - ستكون هذه طريقة رائعة للعثور على صفحاتك.

روابط انفوجرافيك

المتطلبات والصيغ

تدعم Google العديد من تنسيقات ملفات Sitemap. يمكن العثور على جميع التنسيقات والمعايير على هذا العنوان: https://www.sitemaps.org/index.html.

تقصر جميع التنسيقات ملف Sitemap على 50 ميغابايت (غير مضغوط) و 50000 عنوان. إذا كان لديك ملف أكبر أو عناوين أكثر ، فستحتاج إلى إنشاء ملف فهرس بجميع الخرائط (الموضحة في المقالة أدناه).

التوصيات الرئيسية هي:

  • يجب ترميز الملف باستخدام UTF-8 ؛
  • يجب أن يبدأ بعلامة مفتوحة وينتهي بعلامة إغلاق مثل…. ؛
  • تحديد البروتوكول القياسي في العلامة ؛
  • العلامة الرئيسية لكل إدخال URL ؛
  • حدد عنوان URL الذي يبدأ بالبروتوكول (https أو http) في العلامة ، والتي يجب أن تشارك في العلامة الرئيسية للحفظ.

السمات الاختيارية الإضافية لخرائط مواقع XML

لا تستخدم Google السمة على مواقعها. تتوفر جميع السمات الأخرى ، لكن ذلك يعتمد على ما إذا كانت ستنعكس أم لا. لذلك ، ضع في اعتبارك أن Google لا تأخذ هذه العلامات على محمل الجد. هم انهم:

  • - يمثل تاريخ آخر تغيير للملف. يجب أن يكون بتنسيق W3C Datetime ؛
  • - عدد مرات تحديث الصفحة. توفر هذه القيمة معلومات عامة حول محركات البحث. يمكن أن تكون القيم الصالحة دائمًا ، كل ساعة ، يوميًا ، أسبوعيًا ، شهريًا ، سنويًا ، أبدًا.

يجب أن يؤخذ في الاعتبار أن قيمة هذه العلامة تعتبر بمثابة تلميح أكثر منها أمرًا. ترى الروبوتات هذه المعلومات وتأخذها في الاعتبار ، لكنها في النهاية تقرر بنفسها ما إذا كانت ستستخدمها ، اعتمادًا على العديد من العوامل الأخرى.

  • - يعطي الأولوية لعنوان URL على عناوين URL الأخرى على موقعك. تتراوح القيم الصالحة من 0.0. إلى 1.0.

هنا مرة أخرى ، يجب أن يوضع في الاعتبار أن هذه الأولوية نسبية وليست شرطًا إلزاميًا للروبوتات ، أو على الأقل لم يتم قبولها على هذا النحو. ومع ذلك ، إذا قررت تجربته ، فاستخدم الدليل التالي:

    • 0 - 0.3: أخبار قديمة ، معلومات لم تعد صالحة ، لكنها مفيدة من الناحية التاريخية ؛
    • 4 - 0.7: مقالات المدونة ، فئات الصفحات ، الأسئلة المتداولة ؛
    • 8 - 1.0: الصفحة الرئيسية وصفحات المنتج وجميع الصفحات ذات المحتوى المحسن جيدًا.

يوضح المثال التالي ملف Sitemap يحتوي على عنوان URL واحد فقط ويستخدم جميع العلامات الاختيارية المكتوبة بخط مائل .

https://netpeak.bg

2018-09-15

شهريا

0.8

تحديد الصفحات المهمة

أضف صفحات عالية الجودة وتلك التي تم تحسينها جيدًا. الجودة الشاملة لها أهمية كبيرة لتحسين الترتيب. يعد هذا عاملاً جادًا لشركة Google ويمكن أن يمنحك أولوية جدية على المنافسة.

لا نرغب في زيارة صفحات منخفضة الجودة ، وكذلك برامج روبوت Google. إذا قمت بإرشادك إلى آلاف الصفحات غير المفيدة للمستخدمين ولم يتم تحسينها جيدًا ، فقد يكون ذلك ضارًا لك فقط. ما هي الصفحات عالية الجودة؟ ببساطة ، تلك هي الصفحات التي:

  • لديها محتوى فريد كافٍ ؛
  • إشراك المستخدمين بسرعة عن طريق المطالبة باتخاذ إجراء (التعليقات ، المراجعات ، إلخ) ؛
  • تشمل الصور ومقاطع الفيديو وما إلى ذلك ؛
  • لا تنتهك سياسات Google ؛

الصفحات مفتوحة للفهرسة

تمثل ميزانية الزحف بشكل عام عدد الصفحات التي تم الزحف إليها لكل وحدة زمنية (يوم ، أسبوع ، شهر ، وما إلى ذلك). لذلك ، لا ينصح بإهدارها دون داع.

لا ينبغي إضافة الصفحات التي تحتوي على علامة وصفية “Noindex” إلى خريطة الموقع. لاتباع ترتيب منطقي من المهم لكل شيء.

من الضروري إجراء فحص آلي وعدم تضمين العناوين المغلقة للفهرسة.

يوصى باتباع التعليمات التالية:

  • إذا كانت الصفحة https://example.com/category/product تحتوي على علامة وصفية "noindex" ، فلا يجب تضمينها في خريطة XML الخاصة بالموقع ؛

لقطة شاشة بدون فهرس

  • عندما يتم إغلاق الصفحة للفهرسة عبر ملف robots.txt ، يجب عدم تضمينها في خريطة XML:

عدم السماح: / الفئة / المنتج

Noindex: / فئة / منتج

  • إذا تم إغلاق الصفحة للفهرسة عبر X-Robots-Tag في رأس HTTP ، فيجب أيضًا عدم تضمينها في خريطة XML للموقع:

HTTP / 1.1 200 موافق

التاريخ: الثلاثاء ، 25 مايو 2010 21:42:43 بتوقيت جرينتش

(...)

X-Robots-Tag: noindex

(...)

النسخ المتعارف عليها من الصفحات

سيتم اعتبار الوصول إلى صفحة واحدة من خلال عناوين URL متعددة ذات محتوى مشابه مكررًا بواسطة Google.

يجب عليك استخدام السمة "link rel canonical" لإرشاد الروبوت الذي يمثل الصفحة "الرئيسية" والتي يجب الزحف إليها وفهرستها.

نسخة متعارف عليها من مخطط معلومات موقع ويب

على سبيل المثال ، إذا كانت الصفحة https://example.com/category/product-1 تحتوي على عنوان https://example.com/product ، فيجب ألا يشارك http://example.com/category/product-1 في خريطة موقع XML.

يجب عليك إجراء فحص آلي لأن أتمتة العمليات ستجلب لك بالتأكيد صداعًا أقل وتوفر لك الوقت لإجراء عمليات الفحص اليدوي.

الصفحات التي ترجع 200 موافق

قم بتضمين العناوين التي تُرجع استجابة 200 موافق. من المهم إجراء عمليات تحقق آلية وعدم تضمين العناوين التي تُرجع استجابة بخلاف 200 موافق - على سبيل المثال 404 ، 301 ، إلخ.

على سبيل المثال ، إذا عرضت الصفحة https://example.com/product استجابة مختلفة عن 200 موافق ، فلا يجب أن تشارك في خريطة الموقع.

فحص رأس استجابة HTTP

يمكنك استخدام الأداة التالية للتحقق: https://soft.galinov.com/ للتحقق.

صفحات من ترقيم الصفحات

ليس من الضروري تضمين كافة الصفحات في ملف sitemap.xml تمامًا. الروبوت ذكي بما يكفي ليكون قادرًا على التنقل من الصفحة الأولى في الفئة ذات الصلة إذا تم وصفها بشكل صحيح. يوصى بالقيام بما يلي:

  • تشمل فقط الصفحات الرئيسية للفئات ؛
  • قم بتمييز الصفحات بـ rel = next / rel = prev حتى يتمكن الروبوت من رؤية الاتصال بينها ؛
  • يجب أن تحتوي كل صفحة من صفحات ترقيم الصفحات على توجيه أساسي لنفسها ، وليس إلى الصفحة الرئيسية ، لأنه إذا كان العكس هو الصحيح ، فهذا يعني أنك تخبر الروبوت "لا يهم أن لدي 5000 منتج و 20 صفحة ، فهم هي نفسها الأولى ".

على سبيل المثال ، يجب ألا تشارك الصفحة https://example.com/category/page-2 في الخريطة. هنا يمكنك العثور على رأي Google الرسمي ، بالإضافة إلى توصياتهم:

تصغير حجم الملف

زاد كل من Google و Bing أحجام الملفات من 10 ميغابايت إلى 50 ميغابايت في عام 2016 ، ولكن لا يزال من الأفضل إبقاء ملف Sitemap صغيرًا قدر الإمكان.

خرائط مواقع Bing و google

بالطبع ، لا داعي للقلق ، ولكن إذا كان ملف Sitemap الخاص بك يحتوي على أكثر من 50000 عنوان URL أو يتجاوز حجمه 50 ميغابايت ، فيجب تقسيمه إلى المزيد من خرائط XML. في هذه الحالة ، يجب وصف المراجع لجميع خرائط XML في ملف فهرس خريطة موقع منفصل.

ما هو ملف فهرس خريطة موقع XML

مخطط معلومات ملف فهرس Sitemap

يمكنك إرسال ملفات Sitemap متعددة ، ولكن يجب أن يتوافق كل ملف مع القواعد المذكورة أعلاه. إذا أردت ، يمكنك ضغط الملفات باستخدام gzip لتقليل حجمها وفقًا للمتطلبات.

تنسيق XML لملف الفهرس مشابه جدًا للتنسيق العادي لخريطة الموقع. يجب أن تحتوي على:

  • فتح وإغلاق العلامة باسم ؛
  • إدخال لكل ملف Sitemap مع سمة XML الرئيسية ؛
  • علامة على السمة الرئيسية.

يتم أيضًا تضمين السمة الموصى بها.

ملاحظة: يمكن لملف فهرس Sitemap سرد الخرائط الموجودة على نفس الموقع فقط. فمثلا:

https://example.com/sitemap_index.xml قد يتضمن خرائط على https://example.com ، لكن ليس على https://www.saitprimer.com أو https://www.example.com

كما هو الحال مع جميع الملفات الأخرى ، يجب ترميز ملف الفهرس باستخدام UTF-8.

يوضح المثال التالي فهرس Sitemap الذي يسرد خريطتين:

http://www.example.com/sitemap1.xml.gz

2018-10-01 T18: 23: 17 + 00: 00

http://www.example.com/sitemap2.xml.gz

2017-01-01

وصف النسخة المحمولة

نحتاج إلى مساعدة روبوت Google في العثور على المحتوى الخاص بنا وفهم الاتصال بين صفحات سطح المكتب وصفحات الجوال. في ملف Sitemap بتنسيق XML ، يجب إضافة السمة rel = "alternate" لصفحات إصدار سطح المكتب ، على النحو التالي:

xmlns: xhtml = ”http://www.w3.org/1999/xhtml”>

http://www.example.com/page-1/

<xhtml: link

rel = ”alternate”

media = "فقط الشاشة و (max-width: 640px)"

href = ”http://m.example.com/page-1 ″ />

ضع في اعتبارك أن كل صفحة سطح مكتب يجب أن تتوافق مع صفحة واحدة من إصدار الهاتف المحمول. لا يوصى ، على سبيل المثال ، بربط العديد من صفحات سطح المكتب عبر rel = “alternate” بصفحة واحدة من إصدار الجوال والعكس صحيح.

يجب عليك أيضًا التحقق من عمليات إعادة التوجيه. من المهم أن تتوافق صفحة سطح المكتب مع نفس المحتوى في إصدار الهاتف المحمول ، وليس إعادة التوجيه إلى صفحة أخرى. معلومات إضافية هنا.

مخطط معلومات إعادة توجيه الجوّال

كيف يمكن للروبوتات العثور على ملف XML Sitemap الخاص بك

عند الانتهاء من أتمتة العملية بالكامل وتحميلها على الخادم الخاص بك (أو إنشائها بواسطة مكون إضافي) ، تحتاج إلى ترك دليل حيث يمكن أن تعثر عليه الروبوتات.

أفضل طريقة هي تضمين ارتباط لها في ملف robots.txt الخاص بك. يُطلق على هذا أيضًا اسم Sitemap Discovery وهو شيء قدمته Google و Bing و Yahoo مرة أخرى في عام 2007 لمساعدة برامج الروبوت الخاصة بهم في العثور على ملفات Sitemap بتنسيق XML.

كل ما عليك فعله هو تضمين المسار الكامل لخريطتك أو ملف الفهرس.

لقطة شاشة لملف فهرس المسار الكامل

التحويل الصوتي الصحيح للعناوين

تؤكد وثائق Google الرسمية (إنشاء ملف Sitemap وإرساله) على أن جميع قيم البيانات (بما في ذلك عناوين URL) يجب أن تحتوي على أحرف ASCII فقط. لا يمكن أن تحتوي على رموز تحكم أو أحرف خاصة مثل * أو {}.

إذا كان عنوان URL لموقعك يحتوي على هذه الأحرف ، فستتلقى خطأً عند محاولة إضافته.

أرسل خريطتك إلى Google
يمكنك إرسال خريطة موقعك إلى Google عبر Google Search Console.

لقطة شاشة google search console

تحقق من وجود أي أخطاء قبل الإرسال. من المهم توضيح أي أخطاء قد تكون عقبة أمام فهرسة الصفحات المقصودة الرئيسية.

من الناحية المثالية ، يجب أن يكون عدد الصفحات المفهرسة مساويًا لعدد الصفحات المقدمة.

استنتاج

  1. كن متسقًا - إذا تم حظر الصفحة بواسطة ملف robots.txt أو بواسطة "noindex" ، فمن الأفضل ألا تكون في خريطة XML الخاصة بك.
  2. أتمتة العملية الخاصة بك - يجب أن تكون جميع التوصيات المذكورة أعلاه متاحة للأتمتة ، حيث سيوفر ذلك الوقت ، ويساعد ميزانية الزحف على البقاء محسّنة ، كما يوفر لك الكثير من المتاعب.
  3. إذا كان لديك موقع كبير جدًا ، فاستخدم ملف فهرس بخرائط مختلفة مما سيوفر لك وقت الخادم وسيغطي جميع الصفحات المهمة على موقعك.