Creación de herramientas para comprender el rendimiento del contenido

Publicado: 2020-09-03

El contenido es una de las principales fuerzas que impulsan una estrategia de marketing entrante y el SEO es una parte integral para que funcione. En general, esto cubrirá los conceptos básicos del SEO en la página: estructura del artículo, ubicación de palabras clave, etiquetas meta, etiquetas de título, texto alternativo, encabezados, datos estructurados y uso de formato para crear datos estructurados informalmente en listas y tablas.

Auditoría de SEO en la página como parte de la gestión de contenido, utilizando OnCrawl.

Esto cae bajo el paraguas del SEO técnico cuando comienza a optimizar o monitorear en masa, ya sea a través de auditorías del sitio o rastreos regulares, a través de meta descripciones de lenguaje natural generadas por máquinas, etiquetas de control de fragmentos o inyección de datos estructurados.

Sin embargo, la intersección del SEO técnico y el marketing de contenido es aún mayor en lo que respecta al rendimiento del contenido: observamos los mismos datos primarios, como el rango de página en los SERP o la cantidad de clics, impresiones y sesiones. Podríamos implementar los mismos tipos de soluciones o usar las mismas herramientas.

¿Qué es el rendimiento del contenido?

El rendimiento del contenido es el resultado medible de cómo la audiencia interactúa con el contenido. Si el contenido genera tráfico entrante, las medidas de ese tráfico reflejan qué tan bien o mal ese contenido está haciendo su trabajo. Toda estrategia de contenidos debe, en base a objetivos concretos, definir sus KPIs particulares. La mayoría incluirá las siguientes métricas:

  • Qué tan visible es el contenido en la búsqueda (impresiones en SERP)
  • Qué tan pertinentes los motores de búsqueda piensan que es el contenido (clasificación en SERP)
  • Cómo los buscadores pertinentes piensan que es la lista de búsqueda del contenido (clics de SERP)
  • Cuántas personas ven el contenido (visitas o sesiones en una solución de análisis)
  • Cuántas personas interactúan con el contenido de una manera que promueve los objetivos comerciales (seguimiento de conversiones)

Hasta aquí todo bien.

La dificultad está en colocar el cursor: ¿qué números significan que tienes un buen rendimiento de contenido? ¿Que es normal? ¿Y cómo sabes cuando algo no va bien?

A continuación, compartiré mi experimento para crear una "prueba de concepto" de una herramienta de baja tecnología para ayudar a responder estas preguntas.

¿Por qué exigir un estándar para el rendimiento del contenido?

Estas son algunas de las preguntas que quería responder como parte de mi propia revisión de la estrategia de contenido:

  • ¿Hay alguna diferencia entre el contenido interno y las publicaciones de invitados en términos de rendimiento?
  • ¿Hay temas que estamos impulsando que no funcionan bien?
  • ¿Cómo puedo identificar publicaciones "siempre verdes" sin esperar tres años para ver si todavía atraen tráfico semanal?
  • ¿Cómo puedo identificar los impulsos menores de la promoción de terceros, como cuando se recoge una publicación en un boletín que no estaba en nuestro radar de promoción, para adaptar de inmediato nuestra propia estrategia de promoción y capitalizar la mayor visibilidad?

Sin embargo, para responder a cualquiera de estas preguntas, debe saber cómo se ve el rendimiento del contenido "normal" en el sitio con el que está trabajando. Sin esa línea de base, es imposible decir cuantitativamente si una pieza específica o un tipo de contenido funciona bien (mejor que la línea de base) o no.

La forma más fácil de establecer una línea de base es mirar las sesiones promedio por día después de la publicación, por artículo, donde el día cero es la fecha de publicación.

Esto producirá una curva similar a esta, que muestra un pico de interés inicial (y posiblemente los resultados de cualquier promoción que realice, si no ha limitado su análisis a las sesiones de los motores de búsqueda únicamente), seguido de una cola larga de menor interés:

Datos reales para una publicación típica: un pico en la fecha de publicación o poco después, seguido de una larga cola que, en muchos casos, eventualmente genera más sesiones que el pico original.

Una vez que sepa cómo se ve la curva de cada publicación, puede comparar cada curva con las demás y establecer qué es "normal" y qué no.

Si no tienes una herramienta para hacer esto, esto es un dolor en el cuello.

Cuando comencé este proyecto, mi objetivo era usar Hojas de cálculo de Google para construir una prueba de concepto, antes de comprometerme a aprender suficiente Python para cambiar la forma en que examino el rendimiento del contenido.

Desglosaremos el proceso en fases y pasos:

  1. Encuentre su línea de base
    – Enumere el contenido que desea estudiar
    – Averigüe cuántas sesiones recibió cada pieza de contenido cada día
    – Reemplace la fecha en la lista de sesiones con el número de días desde la publicación
    – Calcular la curva “normal” para usar como línea de base
  2. Identifique el contenido que no se parece a la línea de base
  3. Mantenlo actualizado

Encuentre la línea de base de rendimiento de su contenido

Enumere el contenido que desea estudiar

Para empezar, debe establecer una lista del contenido que desea examinar. Para cada pieza de contenido, necesitará la URL y la fecha de publicación.

Puedes obtener esta lista como quieras, ya sea que la construyas a mano o utilices un método automatizado.

Usé un script de aplicaciones para extraer cada URL de contenido y su fecha de publicación directamente desde el CMS (en este caso, WordPress) usando la API y escribí los resultados en una hoja de Google. Si no se siente cómodo con las secuencias de comandos o las API, aún es relativamente fácil; puede encontrar múltiples ejemplos en línea de cómo hacer esto para WordPress.

Tenga en cuenta que querrá comparar estos datos con los datos de la sesión para cada publicación, por lo que deberá asegurarse de que el "slug" en esta hoja coincida con el formato de la ruta URL proporcionada por su solución de análisis.

Encuentro que es más fácil construir el slug completo (ruta URL) aquí, en la columna E anterior, en lugar de modificar los datos extraídos de Google Analytics. También es menos pesado computacionalmente: ¡hay menos líneas en esta lista!

Fórmula de ejemplo para crear una URL completa para este sitio: busque el número de categoría proporcionado por el CMS en una tabla y devuelva el nombre de la categoría, que se coloca antes del slug del artículo, coincidiendo con el patrón de URL para este sitio (https://sitio .com/categoryName/articleSlug/)

Si no tiene acceso al backend, puede crear su lista extrayendo esta información de su sitio web, por ejemplo, durante un rastreo. Luego puede exportar un CSV de los datos que desea e importarlo a una hoja de cálculo de Google.

Configuración de un campo de datos en OnCrawl para raspar las fechas de publicación del blog de un sitio web.

Datos, incluida la URL y la fecha de publicación extraída, en el Explorador de datos de OnCrawl, listos para exportar.

Averigüe cuántas sesiones por día ha ganado cada pieza de contenido

A continuación, necesita una lista de sesiones por pieza de contenido y por día. En otras palabras, si un contenido tiene 30 días de antigüedad y recibió visitas todos los días durante ese período, desea tener 30 filas para él, y así sucesivamente para el resto de su contenido.

Necesitará una hoja separada en el mismo documento para esto.

El complemento de Google Analytics para Hojas de cálculo de Google hace que esto sea relativamente fácil.

Desde la vista de Google Analytics con los datos que desees, puedes solicitar un informe de:

fechas Métrica Dimensiones
Desde hace 1000 días
Hasta ayer. Los datos de hoy aún no están completos porque el día aún no ha terminado. Si lo incluye, no se verá como un día completo "normal" y reducirá todas sus estadísticas.
Sesiones

Nos interesa el número de sesiones.

Páginas de destino
Esto enumera las sesiones para cada página de destino por separado. Fecha
Esto enumera las sesiones para cada fecha por separado, en lugar de darnos un total de 1000 días.

El uso de segmentos de sus datos de Google Analytics es extremadamente útil en esta etapa. Puede, por ejemplo, limitar su informe a un segmento que contenga solo las URL de contenido que le interesa analizar, en lugar de todo el sitio. Esto reduce significativamente la cantidad de filas en el informe resultante y simplifica mucho el trabajo con los datos en Hojas de cálculo de Google.

Además, si tiene la intención de observar solo el rendimiento orgánico con fines estrictamente de SEO, su segmento debe excluir los canales de adquisición que no se pueden atribuir al trabajo de SEO: referencias, correo electrónico, redes sociales...

No olvide asegurarse de que el límite sea lo suficientemente alto como para no truncar los datos por error.

Calcular el número de días desde la publicación

Para calcular la cantidad de días desde la publicación de cada punto de datos del artículo, debemos unir (o, si es usuario de Data Studio, "combinar") los datos del informe de sesiones con los datos de su lista de piezas de contenido. .

Para ello, utilice la URL o la ruta de la URL como clave. Esto significa que la ruta de la URL debe tener el mismo formato tanto en la tabla CMS como en el informe de Google Analytics.

Creé una tabla separada para poder eliminar cualquier parámetro de la página de destino en mi informe de Analytics. Así es como configuro mis columnas:

  • Página de destino
    Borra los parámetros del slug de URL en el informe de Analytics
    Ejemplo de fórmula:

  • Fecha
    Fecha en que se registraron las sesiones, del informe de Analytics
    Ejemplo de fórmula:

  • Sesiones
    Fecha en que se registraron las sesiones, del informe de Analytics
    Ejemplo de fórmula:

  • Días después de la publicación
    Busca la fecha de publicación de esta URL en la columna de la tabla CSM que acabamos de crear y la resta de la fecha en que se registraron estas sesiones. Si la URL no se puede encontrar en la tabla CMS, informa una cadena vacía en lugar de un error.
    Ejemplo de fórmula:

Tenga en cuenta que mi clave de búsqueda, la ruta de URL completa, no es la columna más a la izquierda en mis datos; Tuve que cambiar la columna E antes de la columna C para los fines de BUSCARV.

Si tiene demasiadas filas para completar esto a mano, puede usar un script como el que se muestra a continuación para copiar el contenido en la primera fila y completar las siguientes 3450 más o menos:

 función Rellenar() {
    var hoja de cálculo = SpreadsheetApp.getActive();
    hoja de cálculo.getRange('F2').activate();
    spreadsheet.getActiveRange().autoFill(spreadsheet.getRange('F2:F3450), SpreadsheetApp.AutoFillSeries.DEFAULT_SERIES);
};

Calcule el número "normal" de sesiones por día después de la publicación

Para calcular los números de sesión normales, he usado una tabla dinámica bastante sencilla, junto con un gráfico. En aras de la simplicidad, comencé observando el número promedio de sesiones por día después de la publicación.

Este es el promedio frente a la mediana de las sesiones durante los 1000 días posteriores a la publicación. Aquí empezamos (?) a ver los límites de Google Sheets como proyecto de visualización de datos:

Este es un sitio B2B con picos de sesiones de lunes a viernes en todo el sitio; publica artículos algunas veces por semana, pero siempre en los mismos días. Casi puedes ver los patrones semanales.

En este caso, para fines de visualización, probablemente sería mejor mirar los promedios móviles de 7 días, pero aquí hay una versión rápida que simplemente se suaviza por semanas desde la publicación:

A pesar de esta visión a largo plazo, para los próximos pasos limitaré el gráfico a 90 días después de la publicación para permanecer dentro de los límites de Hojas de cálculo de Google más adelante:

La búsqueda de anomalías

Ahora que sabemos cómo se ve la publicación promedio en un día determinado, podemos comparar cualquier publicación con la referencia para averiguar si tiene un rendimiento superior o inferior.

Esto se sale de "mano" rápidamente si lo hace manualmente. Dejando de lado los juegos de palabras, al menos intentemos automatizar algo de esto.

Cada publicación (que tenga menos de 90 días) debe compararse con la línea de base que acabamos de establecer para cada día en nuestra ventana de 90 días.

Para esta prueba de concepto, calculé la diferencia porcentual del promedio diario.

Para un análisis riguroso, querrá observar la desviación estándar de las sesiones por día y establecer a cuántas desviaciones estándar se encuentra el rendimiento de la pieza de contenido individual con respecto a la línea de base. Es más probable que un recuento de sesiones que se encuentra a tres desviaciones estándar del rendimiento promedio sea una anomalía que algo que difiera del promedio de ese día en más de un X%.

Usé una tabla dinámica para seleccionar cada pieza de contenido (con sesiones en los últimos 90 días) que tiene al menos un día de anomalías durante ese período:

En Google Sheets, las tablas dinámicas no pueden crear más de 100 columnas. De ahí la limitación de 90 días para este análisis.

Tracé esta tabla. (Idealmente, me gustaría trazar la curva completa de 90 días para cada uno de estos artículos, pero también me gustaría que la hoja responda si hago clic en una curva).

Mantener las cosas actualizadas: Automatizar actualizaciones

Hay tres elementos principales aquí:

  1. la línea de base
  2. Las piezas de contenido que desea rastrear
  3. El rendimiento de estas piezas de contenido

Desafortunadamente, ninguno de estos es estático.

Teóricamente hablando, el rendimiento promedio evolucionará a medida que mejore la orientación y la promoción de su contenido. Esto significa que deberá volver a calcular la línea base de vez en cuando.

Y si su sitio web tiene picos y valles estacionales, podría valer la pena mirar los promedios durante períodos de tiempo más cortos, o del mismo período todos los años, en lugar de crear una fusión como lo hicimos aquí.

A medida que publique más contenido, también querrá realizar un seguimiento del contenido nuevo.

Y cuando queramos ver la fecha de la sesión para la próxima semana, no la tendremos.

En otras palabras, este modelo necesita ser actualizado con mayor o menor frecuencia. Hay varias formas de automatizar las actualizaciones, en lugar de reconstruir toda la herramienta desde cero cada vez que esté interesado en echar un vistazo.

Lo más fácil de implementar es probablemente programar una actualización semanal de las sesiones de análisis y extraer nuevas publicaciones (con sus fechas de publicación) al mismo tiempo.

El informe de Google Analytics que utilizamos se puede programar fácilmente para que se ejecute automáticamente a intervalos regulares. La desventaja es que sobrescribe los informes anteriores. Si no desea ejecutar y administrar el informe completo, puede limitarlo a un período de tiempo más corto.

Para mis propósitos, descubrí que mirar una ventana de 7 días me brinda suficiente información para trabajar sin estar demasiado desactualizado.

Mantener un ojo en las publicaciones perennes fuera de la ventana de 90 días

Usando los datos que generamos anteriormente, digamos que fue posible determinar que la mayoría de las publicaciones promedian alrededor de 50 sesiones por semana.

Por lo tanto, tiene sentido estar atento a cualquier publicación cuyas sesiones semanales superen las 50, independientemente de la fecha de publicación:

Los artículos están coloreados por período de publicación: últimos 90 días (azul), último año (naranja) y legado (gris). Los totales semanales están codificados por colores comparándolos con el objetivo de la sesión de 50.

Desglosar el total de sesiones por día en la semana hace que sea fácil diferenciar rápidamente entre publicaciones perennes con un rendimiento bastante constante frente a actividades impulsadas por eventos con un rendimiento desigual:

Contenido Evergreen (rendimiento constante de ±20/día)

Promoción externa probable (bajo rendimiento general fuera de un pico a corto plazo)

Lo que hagas con esta información dependerá de tu estrategia de contenido. Es posible que desee pensar en cómo estas publicaciones convierten clientes potenciales en su sitio web o compararlas con su perfil de vínculo de retroceso.

Limitaciones de Google Sheets para el análisis de contenido

Hojas de cálculo de Google, como probablemente haya notado a estas alturas, es una herramienta extremadamente poderosa, pero limitada, para este tipo de análisis. Estas limitaciones son la razón por la que he preferido no compartir una plantilla con usted: adaptarla a su caso requeriría mucho trabajo, pero los resultados que puede obtener siguen siendo solo aproximaciones pintadas a grandes rasgos.

Estos son algunos de los puntos principales en los que este modelo no cumple:

  • Hay demasiadas fórmulas.
    Si tiene muchas (digamos, miles) de URL de contenido activo, puede ser extremadamente lento. En mis scripts de actualización semanal, reemplazo muchas de las fórmulas con sus valores una vez que se calculan para que el archivo realmente responda cuando lo abro más tarde para analizarlo.
  • Línea de base estática.
    A medida que mejora el rendimiento de mi contenido, solo tengo más piezas de contenido con un "rendimiento superior". La línea de base debe volver a calcularse cada pocos meses para tener en cuenta la evolución. Esto se resolvería fácilmente utilizando un modelo de aprendizaje automático no supervisado para calcular promedios (o incluso para omitir este paso e identificar anomalías directamente).
  • Una línea de base "inexacta".
    La línea de base no tiene en cuenta los cambios estacionales ni los incidentes en todo el sitio. También es muy sensible a los eventos extremos, especialmente si limita su cálculo a un período de tiempo más corto:

Análisis de valores atípicos estadísticamente erróneo.
Particularmente si no tiene muchas sesiones por día por elemento de contenido, afirmar que una diferencia del 10% con respecto a un promedio constituye un rendimiento inusual es un poco incompleto.

Límite arbitrario a 90 días de análisis.
Cualquier límite arbitrario es un problema. En este caso, me impide comprender el rendimiento del contenido perenne y me ciega a los picos en su rendimiento, aunque sé por Google Analytics que las piezas muy antiguas ocasionalmente reciben un aumento repentino de atención, o que algunos artículos obtienen atención de manera constante a medida que avanzan. ellos envejecen Esto no es visible en la herramienta, pero lo es si graficas su curva:

  • Problemas de longitud de hoja.
    Algunas de mis fórmulas y scripts requieren un rango de celdas. A medida que crecen el sitio y las líneas en el informe de sesiones, estos rangos deben actualizarse. (Pero no pueden exceder el número de filas presentes en la hoja, o algunas de ellas crean errores).
  • Incapacidad para graficar curvas completas para cada pieza de contenido.
    ¡Vamos, quiero ver todo!
  • Interactividad limitada con los resultados graficados.
    Si alguna vez ha tratado de seleccionar un punto (o curva) en un gráfico de varias curvas en Hojas de cálculo de Google... sabe de lo que estoy hablando. Esto es aún peor cuando tiene más de veinte curvas en el mismo gráfico y los colores comienzan a verse todos iguales.
  • Posibilidad de pasar por alto el contenido de bajo rendimiento sin sesiones.
    Usando el método que he presentado aquí, es difícil identificar el contenido que constantemente no tiene sesiones. Debido a que nunca aparece en el informe de Google Analytics, no se recoge en el resto del flujo de trabajo (todavía). El contenido que no funciona constantemente aporta poco valor, por lo que, a menos que esté buscando páginas para podar, podría decirse que el contenido que no funciona no tiene su lugar en un informe de rendimiento.
  • Incapacidad para adaptarse al análisis en tiempo real.
    Si bien no requiere mucha mano de obra volver a ejecutar los scripts de generación de informes, promediación y actualización posterior, siguen siendo acciones manuales fuera de la actualización semanal programada. Si la actualización semanal es el miércoles y me preguntas un martes cómo van las cosas, no puedo simplemente consultar la hoja.
  • Limitaciones a la expansión.
    Agregar un eje de análisis, como clasificación o seguimiento de palabras clave, o incluso opciones de filtro por región geográfica, a este informe sería una tarea onerosa. No solo exacerbaría algunos de los problemas existentes, sino que también sería extremadamente difícil implementar una visualización legible y accionable.

¿La conclusión?

Ejecutar los mismos tipos de cálculos en un entorno programático o de aprendizaje automático solucionaría casi todos estos problemas. Esta sería una forma mucho mejor de ejecutar operaciones semicomplejas en un gran conjunto de datos. Además, existen excelentes bibliotecas que utilizan el aprendizaje automático para detectar anomalías de manera confiable en función de un conjunto de datos determinado; hay mejores herramientas para la visualización de datos.

Conclusiones sobre el rendimiento del contenido

El análisis del rendimiento del contenido, incluso con métodos primitivos y defectuosos, refuerza las alertas y la toma de decisiones basada en datos en la estrategia de contenido.

Concretamente, comprender el rendimiento del contenido es lo que te permite:

  • Comprender el valor de las promociones iniciales frente a la actividad de cola larga
  • Detecte rápidamente las publicaciones con bajo rendimiento
  • Aproveche las actividades de promoción externas para impulsar el alcance
  • Reconoce fácilmente lo que hace que ciertas publicaciones sean tan exitosas
  • Identificar ciertos autores o ciertos temas que constantemente superan a otros
  • Determine cuándo el SEO comienza a tener un impacto en las sesiones

Estos datos que impulsan decisiones informadas para promover contenido, y cuándo y cómo, elecciones de temas, perfiles de audiencia y más.

Finalmente, experimentos como este muestran que cualquier dominio para el que pueda obtener datos tiene un uso potencial para las habilidades de codificación, secuencias de comandos y aprendizaje automático. Pero no tienes por qué renunciar a fabricar tus propias herramientas si no tienes todas estas habilidades.

Comienza tu prueba gratuita