Sitemaps XML: por qué importa la secuencia de URL, incluso si Google dice que no lo hace
Publicado: 2023-02-09
Hay muchas cosas que los SEO debaten: haz esto, no hagas eso, esto marca la diferencia pero eso no.
Nadie conoce los secretos de los algoritmos de Google excepto Google (ya veces me pregunto si el algoritmo es demasiado complejo para que algunos en Google sepan cómo funciona).
Dicho esto, hay algunas cosas que Google dice rotundamente que no importa si las hacemos o no. ¿Significa eso que no deberíamos hacerlos? No, no lo hace.
En un mundo perfecto, nuestros sitios web y Google funcionarán exactamente como deberían y a nuestro favor. En realidad, cualquier cantidad de cosas pueden fallar cuando los motores de búsqueda rastrean un sitio.
Si no perjudica a un sitio web implementar algo que pueda mejorar el rastreo y la comprensión de los motores de búsqueda, y es bastante fácil de hacer, ¿por qué no hacerlo?
Los mapas de sitio XML y las etiquetas de prioridad, las etiquetas de frecuencia de cambio y el orden de URL son algunas de esas tácticas de SEO debatidas. Vamos a discutir:
- Conceptos básicos del mapa del sitio XML
- Etiquetas de prioridad
- Cambiar etiquetas de frecuencia
- Entonces, ¿deberíamos usar las etiquetas?
- Secuenciación de URL
Conceptos básicos del mapa del sitio XML
Un mapa del sitio XML es un archivo que los webmasters crean y colocan en su sitio para informar a los motores de búsqueda como Google y Bing sobre las páginas, imágenes y videos que se encuentran en el sitio.
El mapa del sitio funciona como un mapa, lo que ayuda a garantizar un rastreo e indexación más completos. Sin embargo, un mapa del sitio XML no garantiza que los motores de búsqueda indexen o rastreen todas las páginas, ni un mapa del sitio afectará su clasificación.
(Consulte nuestro manual sobre mapas de sitio XML para obtener más información).
Hay etiquetas opcionales que a algunas personas les gusta incluir en su mapa del sitio, como la etiqueta de prioridad y la etiqueta de frecuencia de cambio. La postura oficial de Google es que ignora ambos.
Luego está la práctica o la secuenciación de URL (ordenar las URL en su mapa del sitio en orden de prioridad). Google dice que también ignora esto.
Pero, ¿deberíamos ignorarlo? Hablemos a continuación de estas tres prácticas.
Etiquetas de prioridad
La etiqueta de prioridad le dice a Google qué tan importante es la página de 1 (la más alta) a 0 (la más baja).
Los valores de prioridad del mapa del sitio van de 1,0 a 0,0 y el valor 1,0 indica la página más importante del sitio. Los valores de prioridad se ven así: 1,0, 0,9, 0,8, 0,7, 0,6, 0,5, 0,4, 0,3, 0,2, 0,1 y 0,0. Por ejemplo, 1.0 probablemente sería la página de inicio.
Si usa esta etiqueta, no significa que Google rastreará las páginas que considere más importantes. Depende del algoritmo determinar qué es más relevante y la prioridad puede no coincidir. Puede intentar averiguar qué páginas se rastrean más consultando los registros del servidor.
En general, al usar la etiqueta de prioridad, asignaría valores como este:
- 1.0 – 0.8 = Páginas de categoría, página de inicio, páginas de destino principales
- 0.7 – 0.4 = Artículos de blog, páginas de categoría secundaria, páginas de subcategoría
- 0.3 = 0.0 = Páginas que no son tan importantes como contenido desactualizado o páginas de utilidad
Cambiar etiquetas de frecuencia
La etiqueta de frecuencia de cambio está destinada a decirle a Google con qué frecuencia se actualizan las páginas de su sitio web. En teoría, Google lo vería y tomaría la decisión de rastrear esa página nuevamente en función de cuándo se actualizó por última vez.
Nuevamente, la postura oficial de Google es que ignora la etiqueta de frecuencia de cambio. Y John Mueller de Google ha aclarado que es mejor "especificar la marca de tiempo directamente para que podamos mirar en nuestros sistemas internos y decir que no hemos rastreado desde esta fecha, por lo tanto, debemos rastrear nuevamente".
Esta etiqueta es ciertamente irrelevante si no es precisa. Como menciona Mueller en el video anterior, “vemos muchos sitios que nos brindan esta información en el mapa del sitio, dijeron que cambia diariamente o semanalmente, y buscamos en nuestra base de datos y no ha cambiado en un mes o años. ”
Entonces, ¿deberíamos usar las etiquetas?
El hecho de que las etiquetas se mencionen en la documentación del mapa del sitio XML de Google como "opcionales" es confuso, especialmente cuando dicen que las ignoran. ¿Googlebot realmente los ignora todo el tiempo? Es difícil de saber. Siempre es mejor usarlos, especialmente las fechas de última revisión (<lastmod>).
Creo que hay otra opción que puede hacer con su mapa del sitio para indicar cómo desea que se rastreen los motores de búsqueda. Sin embargo, Google también dice que ignora este método, pero quédate conmigo.
Hemos visto cierto éxito con la indexación a través de la secuenciación de URL, de lo que hablaré a continuación.
Secuenciación de URL
La secuenciación de URL es la práctica de ordenar las URL en su mapa del sitio según la prioridad, pero no en la forma en que funciona la etiqueta de prioridad. Google ignora las etiquetas de prioridad, por lo que piensa que todas las páginas son "iguales", por lo que la secuencia no importa... al menos para la prioridad. Pero las páginas no son iguales en la vida real, especialmente si tiene presupuestos de rastreo bajos.
Recomendamos encarecidamente secuenciar las URL en su mapa del sitio XML de manera que aborde los conceptos de prioridad y frecuencia de cambio sin usar las etiquetas. Aquí, el objetivo es indexar las páginas clave más rápido.
Y, por cierto, ¡solo use URL que coincidan con las etiquetas canónicas que se encuentran en algún lugar de su sitio o que sean páginas importantes!
Por ejemplo, esta es una secuencia que enfatiza las páginas modificadas más recientemente:
- Entradas modificadas recientemente con un día de antigüedad (nuevos objetivos de redirección, páginas nuevas o revisadas) [500 entradas por página XML]
- Entradas de una semana de antigüedad como las anteriores, solo un poco más antiguas [500 entradas por página XML]
- 200 páginas de códigos restantes (ordenadas de forma descendente por impresiones) [1000 entradas por página]
- Cualquier otra página de redireccionamiento (códigos 30x) [5k por página]
- Imágenes y videos [500 por página]
- 404 páginas [10k por página]
- El resto [10k por página]
Básicamente, lo que está haciendo es proporcionar una hoja de ruta a los motores de búsqueda sobre las páginas que cree que deben rastrearse en función de la novedad. Desea que todas las páginas entren en el índice y crea que las páginas rastreadas la semana pasada ya están allí, pero las páginas nuevas no. Utilice nuestras directivas de secuenciación anteriores.
¿Por qué molestarse en hacer esto si Google ha dicho explícitamente que ignora la prioridad y la secuencia?
Con un presupuesto de rastreo ilimitado, pocas redirecciones de sitios web y ningún error, se rastrean todos los archivos. La prioridad y la secuencia no importan. Google tiene razón si las suposiciones se mantienen.
Pero no aguantan . Hay un presupuesto de rastreo, y los redireccionamientos y los 404 lo consumen. Si tiene algo más que una página (imagen, video, hreflang, etc.), las estimaciones de tiempo son incorrectas. Agregue cualquier error significativo y los archivos restantes en el mapa del sitio XML se ignorarán.
Mientras que en un mundo ideal la prioridad y la secuencia no importan, en un mundo con un presupuesto mínimo sí importan. En mi experiencia, la secuencia de las URL en el motor de búsqueda es lo único que importa.
Hemos encontrado que esto aumenta la cantidad de páginas rastreadas y disminuye los problemas de "abandono debido a un error".
Pensamientos finales
Sí, depende de los bots decidir cómo manejar los mapas de sitio XML. Sin embargo, implementar algo que podría ayudar a los motores de búsqueda a rastrear e indexar el contenido de su sitio web, si es lo suficientemente fácil, nunca es una mala idea.
Nuestros expertos en SEO pueden ayudarlo a optimizar su sitio para que pueda rastrearse e indexarse fácilmente. Comuníquese con nosotros para una consulta gratuita.