Las 5 características de Oncrawl más subestimadas
Publicado: 2021-10-20¿Eres un Oncrawler experimentado que cree que conoce la plataforma como la palma de su mano? ¿O se asoció recientemente con nosotros y está buscando consejos de expertos para comenzar? Como parte del equipo de CSM en Oncrawl, tengo una opinión particular sobre las herramientas de la plataforma que he notado que se visitan con menos frecuencia. Entonces, independientemente de su situación, aquí hay un resumen de mis 5 características principales subestimadas de Oncrawl que puede haber pasado por alto o que aún no conoce.
Campos personalizados (raspado de datos)
Un resumen rápido de los campos personalizados en Oncrawl, ofrecemos dos métodos para raspar, XPath y Regex. Y antes de continuar, si necesita una mirada más profunda al raspado web, la extracción de datos de sitios web, consulte este artículo que repasa sus funciones útiles.
Ahora, las funciones de campos personalizados pueden no ser necesariamente innovadoras, pero lo que es increíblemente conveniente es la capacidad de usar una combinación de Regex y XPath en lugar de limitarse a un solo método.
Para decirlo simplemente, Regex y Xpath son métodos para encontrar cosas. En lugar de realizar búsquedas individuales de texto, puede realizar una búsqueda basada en un patrón. Supongamos que desea identificar el mes en este texto, "21 de septiembre", en lugar de buscar "septiembre", con Regex puede usar \w+ para seleccionar la palabra carácter. Mientras que Xpath le permite mostrar elementos de texto de un documento XML o HTML. En este caso, digamos que desea mostrar el contenido dentro del elemento div, comenzará con //div[@class y así sucesivamente. En algunos casos, solo desea mostrar el contenido, en otros, desea identificar un patrón específico, pero a veces necesita una combinación de ambos.
Por ejemplo, supongamos que quiero raspar el precio de todos los artículos de un sitio. En mi primera regla, estoy usando XPath y puede ver que estoy extrayendo los datos sin procesar para verificar que estoy recogiendo el elemento de precio:
Luego, uso Regex para mi segunda regla para seleccionar solo cualquier elemento hasta las comillas, en este caso, el precio: content=”([^\”]+):
Hace que la creación de reglas de raspado sea un poco más rápida y fácil. Y si aún no te sientes cómodo con ninguno de los métodos, aquí tenemos un buen artículo con algunos consejos.
Filtros personalizados en el Explorador de datos
¿Alguna vez te encuentras en el Explorador de datos tratando de recordar los filtros que usaste con el lenguaje de consulta Oncrawl? O tal vez cada vez que está allí, siempre está usando manualmente el OQL para filtrar las páginas rastreadas y agregar cada columna relevante una por una. Bueno, podría ahorrarse un tiempo precioso utilizando la función de filtros personalizados, que se encuentra convenientemente ubicada a la derecha de las opciones de DataSet:
Tiene la opción Filtros rápidos que se compone de consultas comunes, y cada filtro personalizado que guarde se agregará en la sección 'Filtros propios' donde puede recuperar fácilmente las páginas que está buscando. Esto se puede hacer para cada conjunto de datos disponible para usted, de manera predeterminada, tendrá páginas y enlaces, pero si tiene habilitado el monitoreo de registros en su suscripción, verá la opción de monitoreo de registros: páginas y monitoreo de registros: eventos.
Todo lo que tiene que hacer es usar el OQL para filtrar las páginas, aquí estamos viendo las páginas activas de SEO para el 18 de agosto, específicamente para el grupo de páginas de Blog:
Y luego puede usar el menú desplegable ("AGREGAR COLUMNAS") para agregar las métricas relevantes a su búsqueda:
Luego haga clic en "GUARDAR FILTROS" para guardar su filtro personalizado y estará disponible en "Filtros propios"
Registro de alertas/notificaciones
Una adición reciente a nuestras actualizaciones de funciones para 2021 que se puede pasar por alto es la opción para habilitar las alertas de registro: es una excelente manera de estar al tanto de cualquier problema de procesamiento con sus registros. Entonces, en lugar de esperar a descubrir un problema con cualquier depósito cuando inicie sesión en la plataforma, habilite las alertas de registro para informarle cuándo no se han depositado registros recientemente o si lo que se depositó no se considera útil.
Es bastante sencillo de usar, diríjase a su proyecto que tiene habilitado el Monitoreo de registros y haga clic en la pestaña "Herramientas del administrador de registros":
Una vez que esté en el informe Herramientas del administrador de registros, haga clic en "Configurar notificaciones":
Desde aquí, podrá habilitar las notificaciones y definir un umbral para cuándo debe ser contactado si no se han depositado líneas útiles o archivos nuevos.
Esto puede ahorrarle tiempo al descubrir qué es exactamente lo que salió mal con algunos depósitos, lo que lo acerca mucho más a tener informes actualizados antes.
[Ebook] Cuatro casos de uso para aprovechar el análisis de registros de SEO
Herramientas del administrador de registros
Ya que estamos en el tema de los registros, parece adecuado mencionar que el informe Herramientas del administrador de registros es otra gran área de la plataforma que a menudo no se utiliza con tanta frecuencia como podría. Es un pequeño y agradable centro escondido en el nivel del proyecto que se compone con los detalles sobre qué se deposita exactamente, en lo que respecta a los archivos de registro.
Cuando ingrese, no solo verá los archivos exactos que se han depositado, verá la fecha y hora exactas de cada depósito, el desglose de cada tipo de línea de registro (OK, filtrado, erróneo), un gráfico que monitorea la cantidad de aciertos de bots falsos detectados por fecha de depósito, y puede ver un desglose de la calidad de los registros depositados y la distribución de líneas útiles.
Es un excelente lugar para verificar la calidad de los depósitos de archivos, por ejemplo, para asegurarse de que los archivos estén comprimidos, si realmente está depositando líneas relacionadas con SEO, como visitas orgánicas y visitas de bots, y verificando la frecuencia de los depósitos.
Si comienza a notar algo extraño con sus informes de registro, un excelente lugar para comenzar su investigación es en las herramientas del administrador de registros. Es posible que descubra que el formato de la línea de registro ha cambiado y que nuestro equipo de Customer Success necesita actualizar el analizador, o tal vez observe que el nombre del depósito ha cambiado y necesita enviarnos nuevas credenciales. En cualquier caso, siempre puede echar un vistazo y comunicarse con nosotros si necesita ayuda para profundizar más.
Segmentaciones personalizadas
Por último, pero no menos importante, nuestra incorporación más reciente a nuestro arsenal, ¡Segmentaciones personalizadas! Ahora tenemos una colección de plantillas de segmentación para inspirar a los nuevos en Oncrawl que nunca han trabajado en una segmentación, o para hacer que el desarrollo de uno sea un poco más sencillo.
Repaso rápido de las segmentaciones, son esenciales para el desarrollo, ya que desea saber qué parte del sitio está mirando al inspeccionar los resultados del rastreo. Pueden ser tan simples como agrupar páginas por la primera ruta en la URL, o pueden ser tan específicas como agrupar páginas por un rango de sesiones de GA.
Además de las plantillas que ahora le brindan una pequeña guía sobre por qué debería usarlas, también tendrá varias plantillas disponibles de acuerdo con los conectores de datos externos que configuró para el proyecto.
Entonces, si tiene datos de registro, tendrá una sugerencia de plantilla para Visitas de SEO o visitas de bots, y si tiene Google Search Console conectado, verá la opción para crear una segmentación basada en Posiciones o Páginas de clasificación.
Depende de usted cómo desea ver el sitio, estamos aquí para hacerlo un poco más fácil. Así que adelante, pruébalo y dinos lo que piensas.