Enlace interno: ¿cómo determinar las páginas más importantes para enlazar?

Publicado: 2021-05-03

Si los enlaces externos (backlinks) son una de las áreas de mejora que a menudo se mencionan para mejorar su SEO, los enlaces internos a menudo se pasan por alto, pero también son importantes. De hecho, una buena estructura de enlaces internos puede marcar la diferencia en sectores muy competitivos.

Si, para un sitio pequeño, definir las páginas más importantes para vincular primero puede ser una tarea relativamente fácil, ¿qué pasa con los sitios con miles o incluso millones de páginas?

En el artículo de hoy, te explicaré una metodología que puedes aplicar a tu proyecto para determinar las páginas prioritarias.

Análisis N-gram de nuestras palabras clave

Primero, debemos entender qué palabras clave se usan con más frecuencia para buscar nuestro producto o servicio. Si alguna vez ha abierto un informe de Google Search Console, probablemente habrá notado que pueden existir muchas estructuras de palabras clave. Por ejemplo, para la compra de un vuelo entre dos ciudades diferentes, tomemos Lyon y Barcelona, ​​las búsquedas pueden ser:

  • vuelo lyon barcelona
  • vuelo lyon barcelona
  • Vuelo barato lyon barcelona
  • Etc.

Tener este tipo de pluralidad de estructuras de palabras clave no es específico de la industria de viajes, y probablemente tenga una situación similar en su propia industria.

Sin embargo, es fundamental saber qué estructuras son las más utilizadas para poder realizar correctamente nuestro análisis. ¿Cómo podemos hacer esto? Simplemente realizando un análisis de n-gramas (secuencia de N palabras utilizadas como palabra clave) de nuestros propios datos de Google Search Console.

Antes de explicar cómo hacer esto, déjame aclarar una cosa: desafortunadamente, los datos de Google Search Console no son perfectos.

[Estudio de caso] Cómo el SEO orientado a los negocios aumenta el tráfico y las conversiones

Gracias a una estrategia de SEO ganadora que se centró en administrar contenido duplicado, mejorar la estructura del sitio y analizar el comportamiento de Googlebot, carwow creció como negocio. Descubre cómo mostrar resultados reales a partir de una estrategia SEO basada en el ROI del negocio.
Lea el estudio de caso

Limitaciones

Antes de comenzar nuestro análisis, debemos tener en cuenta que las métricas que muestra la herramienta cuando incluye la dimensión "consulta" solo representan el 30-50% (la cifra exacta dependerá de su sitio) del total que se muestra si incluye el dimensión "página", por ejemplo.

En otras palabras: la herramienta sufre de muestreo dimensional. Esto significa que las métricas devueltas por Google Search Console serán diferentes dependiendo de lo que estés analizando (consultas, páginas…). También debo señalar que estos datos los obtuve usando la API, es decir, interactuando con todos los datos disponibles, en lugar de hacerlo a través de la interfaz con la que todos están familiarizados, que solo permite analizar un máximo de 1000 elementos.

Si trabajas con Python, puedes leer la documentación oficial de Google o, mejor aún, usar esta biblioteca que te ahorrará mucho tiempo. Yo mismo lo uso de forma regular.

Dicho esto, Google Search Console sigue siendo más exhaustivo que cualquier otra herramienta de terceros como SEMrush, SEObserver, Ahrefs o Sistrix, por citar solo las más conocidas.

Metodología para obtener tus n-gramas

Para obtener sus n-gramas, debe seguir este procedimiento:

Descarga tus datos de Google Search Console

Es importante descargar sus datos para una sola vertical. Como los n-gramas de una sección de Vuelo y una sección de Tren de su sitio probablemente serán diferentes, si combina sus datos, puede obtener n-gramas válidos solo para la vertical más buscada.

Si su sitio es nuevo o si rara vez aparece en la primera página, le recomiendo que utilice una fuente de datos adicional.

Eliminar variables

En algunos casos, es posible que deba eliminar algunos de los elementos de estas palabras clave. Por ejemplo, supongamos que mi lista contiene solo 4 palabras clave:

  • vuelo paris roma
  • Vuelo barato paris roma
  • vuelo lyon barcelona
  • Vuelo barato lyon barcelona

Quiero obtener n-gramas en forma de estructuras, que contengan variables. Aquí, por ejemplo, quiero quedarme solo: vuelo {{origen}} {{destino}} y vuelo barato {{origen}} {{destino}} , sin las ciudades. En tu caso, puede que tengas que sustituir el nombre de tus productos, la talla, etc… Dependerá de tu industria.

Calcule n-gramas y recupere volúmenes de búsqueda

Puedes usar el sistema que prefieras: en mi caso, uso Python, que tiene la ventaja de ser simple y puede manejar la cantidad de datos que tenemos en una computadora normal (sin colapsarla).

 #importar bibliotecas
importar colecciones
importar nltk
importar numpy como np
importar pandas como pd

#crear una lista de palabras clave únicas
lista_de_palabras clave = informe['consulta'].tolist()

#crear una lista de palabras contenidas en estas palabras clave
list_of_words_in_keywords = [x.split(" ") for x in list_of_keywords]

#cuenta los más comunes
cuentas = colecciones.Contador()
para frase en list_of_words_in_keywords:
  cuenta.update(nltk.ngrams(frase, 1))
  cuenta.update(nltk.ngrams(frase, 2))

También puede usar la función nativa de Oncrawl para analizar su contenido y descubrir algunos n-gramas que no aparecen en Google Search Console (todavía).

Luego, deberá recuperar los volúmenes de búsqueda para cada una de estas estructuras, para obtener una tabla como la siguiente. Esta tabla muestra las estructuras más comunes: las que tienen el mayor número de impresiones para nuestra vertical.

consulta contar impresiones
Vuelo {origen} {destino} 50 167000
Vuelo barato {origen} {destino} 676 30000
Billete {origen} {destino} 300 97000

Buen trabajo por haber llegado a esta etapa. Puedo decirle que quiere saber para qué usaremos esta información. la respuesta esta en la siguiente parte

[Estudio de caso] Cómo el SEO orientado a los negocios aumenta el tráfico y las conversiones

Gracias a una estrategia de SEO ganadora que se centró en administrar contenido duplicado, mejorar la estructura del sitio y analizar el comportamiento de Googlebot, carwow creció como negocio. Descubre cómo mostrar resultados reales a partir de una estrategia SEO basada en el ROI del negocio.
Lea el estudio de caso

Extracción de volúmenes de búsqueda

Recordemos que nuestro objetivo es definir las páginas más importantes a las que enlazar primero.

Para comprender qué páginas tienen el tráfico potencial más alto, necesitamos recuperar los volúmenes de búsqueda de las diferentes estructuras de palabras clave más comunes para cada página. Aquí solo tendremos en cuenta el volumen de búsqueda; ¡la noción de CTR vendrá más tarde!

¿Empiezas a entender para qué servía el paso anterior? Para ganar en eficiencia es obligatorio el uso de una API. Existen muchas soluciones, la mayoría de las cuales son soluciones pagas. Si utilizas DataForSEO, obtener volúmenes para 350.000 palabras clave te costará menos de 40€, por lo que tampoco estamos hablando de una inversión importante.

Al final de este paso, tendrás un archivo con el volumen potencial por URL. Esta es la suma de los volúmenes de los n-gramas más comunes calculados en el paso anterior.

Fusionando los datos

En esta etapa, obviamente no podemos usar estos datos para priorizar las páginas más importantes de nuestro sitio. ¿Por que no?

¡No mezclemos volumen y tráfico!

En algunos casos, incluso si está en la primera posición, su CTR aún puede ser bajo. Esto a menudo se debe a la cantidad de anuncios y funciones SERP que muestra Google sobre su página. Este es un ejemplo de una consulta meteorológica en la que el primer elemento de Google atrae fuertemente la atención del usuario mucho antes de que el usuario pueda llegar al primer resultado orgánico.

Limitaciones de n-gramas

La importancia de las palabras clave de cola larga puede variar según el sector. Las estructuras que no se habrían retenido en el primer paso (o están ocultas por Google Search Console) podrían representar una parte interesante del potencial. Por lo tanto, debemos incluirlos.

Importancia de cada página.

Como experto en SEO, nuestro objetivo no es generar tráfico, sino generar ventas a través de los motores de búsqueda. Por lo tanto, es crucial, si puede, completar este análisis con datos de su departamento de ventas. Por ejemplo, los datos sobre el margen de ventas podrían ayudarlo a determinar qué URL debe priorizar.

Tomemos la tabla del final del paso anterior, y agreguemos otros datos que pueden ser útiles para medir:

  • Exposición potencial (volumen/impresiones)
  • Tráfico real (sesiones/clics)
  • Ingresos (tasa de conversión/margen/ingresos)

Aquí hay un ejemplo de cómo presentar esta tabla:

Ponderación de los datos

Para clasificar cada pieza diferente de contenido de acuerdo con su exposición potencial, tráfico potencial e ingresos, debe decidir cuánto ponderar cada uno de estos elementos.

No puedo proponer porcentajes estándar; depende de usted definir los porcentajes que se adapten a su propia situación.

Estandarización

Tenga en cuenta que aún no podemos definir la importancia de cada una de nuestras páginas. El resultado que obtenemos al ponderar los datos que obtuvimos anteriormente aún no es válido.

Explicación: Por definición, las impresiones serán más altas que los clics y las sesiones. Esto es especialmente cierto en industrias con CTR bajos. Sin procesar nuestros datos de antemano, corremos el riesgo de sobreponderar las impresiones (y subponderar las sesiones).

¿Cómo resolvemos este problema? ¡Al estandarizar nuestros datos! Este proceso nos permite redimensionar las variables numéricas para que sean comparables en una escala común (fuente). A través de la manipulación matemática, nuestra distribución de datos cuantitativos tendrá un valor medio de 0 y una desviación estándar de 1.

Si tienes curiosidad, la fórmula matemática es la siguiente:

X_estándar = valor estandarizado
X = valor inicial
μ = media (promedio) de nuestra distribución
σ = desviación estándar de nuestra distribución

Es muy sencillo aplicar esta fórmula a tus datos:

Aplica esta fórmula a todos los datos que quieras considerar en tu cálculo. Esto definitivamente eliminará el problema de sobreponderar una métrica.

Cálculo de la puntuación

Una vez que haya definido sus pesos y calculado sus valores estandarizados, puede asignar una puntuación a cada una de sus URL para determinar su importancia. En este ejemplo, tenemos 4 métricas, cada una ponderada por igual al 25 %, pero obviamente puede usar otros números.

Por lo tanto, esta metodología le permite colocar primero una URL que es objetivamente la mejor: un volumen de búsqueda más bajo, pero impresiones altas y, sobre todo, un CTR impresionante.

Con esta información, podrás definir tu estructura de enlaces internos de una manera mucho más completa y relevante que si la basaras en un solo criterio, como el volumen de búsqueda. Depende de usted vincular:

  • Desde la página de inicio: las páginas más importantes
  • De una categoría: las páginas más importantes de la categoría en cuestión
  • Y así.

Conclusión

La metodología n-gram es eficiente y tiene la ventaja de ser aplicable a muchos proyectos. Solo necesita adaptarlo utilizando los datos más importantes de su industria. A pesar del uso de un concepto matemático que puede resultar nuevo para algunos (normalización), también es sencillo de explicar y de poner en práctica con las herramientas que tienes a tu disposición.

Te proporcionará la información necesaria para construir tu malla interna en base al potencial y resultados de tus páginas. Una tarea que a veces es compleja de obtener para sitios grandes.

¡Todo lo que tienes que hacer es aplicarlo!