5 recursos mais subestimados do Oncrawl

Publicados: 2021-10-20

Você é um Oncrawler experiente que acha que conhece a plataforma como a palma da mão? Ou você fez uma parceria conosco recentemente e está procurando dicas privilegiadas para começar? Como parte da equipe CSM da Oncrawl, tenho uma visão particular sobre as ferramentas da plataforma que notei serem visitadas com menos frequência. Portanto, independentemente da sua situação, aqui está um resumo dos meus 5 principais recursos subestimados do Oncrawl que você pode ter esquecido ou ainda não conhece!

Campos personalizados (raspagem de dados)

Uma rápida recapitulação dos campos personalizados no Oncrawl, oferecemos dois métodos para raspagem, XPath e Regex. E antes de ir mais longe, se você precisar de uma visão mais profunda da web scraping, extração de dados de sites, confira este artigo que aborda suas funções úteis.

Agora, os recursos de campo personalizados podem não ser necessariamente inovadores, mas o que é incrivelmente conveniente é a capacidade de usar uma mistura de Regex e XPath, em vez de se limitar a um método.
Para simplesmente dizer, Regex e Xpath são métodos para encontrar coisas. Em vez de fazer pesquisas individuais de texto, você pode fazer uma pesquisa com base em um padrão. Digamos que você queira identificar o mês neste texto, “21 de setembro”, em vez de procurar por “setembro”, com Regex você pode usar \w+ para pegar o caractere da palavra. Enquanto o Xpath permite exibir elementos de texto de um documento XML ou HTML. Nesse caso, digamos que você queira exibir o conteúdo dentro do elemento div, você começará com //div[@class e assim por diante. Em alguns casos você quer apenas exibir o conteúdo, em outros você quer identificar um padrão específico, mas às vezes você precisa de uma mistura de ambos.

Por exemplo, digamos que eu queira raspar o preço de todos os itens de produtos em um site. Na minha primeira regra, estou usando o XPath e você pode ver que estou extraindo os dados brutos para verificar se estou pegando o elemento de preço:


Então, eu uso Regex para minha segunda regra para pegar apenas qualquer elemento até as aspas, neste caso, o preço: content=”([^\”]+):

Isso torna a criação de regras de raspagem um pouco mais rápida e fácil. E se você ainda não se sente confortável com nenhum dos métodos, temos um bom artigo aqui com algumas dicas.

Filtros personalizados no Data Explorer

Você já se viu no Data Explorer tentando lembrar os filtros que usou com a Oncrawl Query Language? Ou talvez cada vez que você está lá, você está sempre usando manualmente o OQL para filtrar as páginas rastreadas e adicionar cada coluna relevante uma a uma. Bem, você pode economizar um tempo precioso usando o recurso de filtros personalizados, que está convenientemente localizado à direita das opções do DataSet:

Você tem a opção Quickfilters, que é composta de consultas comuns, e cada filtro personalizado que você salvar será adicionado na seção 'Próprios filtros', onde você pode recuperar facilmente as páginas que está procurando. Isso pode ser feito para todos os conjuntos de dados disponíveis para você, por padrão, você terá Páginas e Links, mas se tiver o Monitoramento de log ativado em sua assinatura, verá a opção Monitoramento de logs: Páginas e Monitoramento de logs: Eventos.

Tudo o que você precisa fazer é usar o OQL para filtrar as páginas, aqui estamos analisando as páginas SEO Active de 18 de agosto, especificamente para o grupo de páginas do Blog:

E então você pode usar o menu suspenso (“ADICIONAR COLUNAS”) para adicionar as métricas relevantes à sua pesquisa:

Em seguida, clique em “SALVAR FILTROS” para salvar seu filtro personalizado e ele estará disponível em “Filtros próprios”


Alerta de registro/notificações

Uma adição recente às nossas atualizações de recursos para 2021, que pode ser negligenciada, é a opção de habilitar o alerta de log – é uma ótima maneira de estar ciente de quaisquer problemas de processamento com seus logs. Portanto, em vez de esperar para descobrir um problema com qualquer depósito ao fazer login na plataforma, ative o alerta de log para que você saiba quando os logs não foram depositados recentemente ou o que foi depositado não é considerado útil.

É bastante simples de usar, vá para o seu projeto que tem o Log Monitoring ativado e clique na guia “Log Manager Tools”:

Quando estiver no relatório Log Manager Tools, você clicará em “Configure Notifications”:

A partir daqui, você poderá habilitar as notificações e definir um limite para quando você deve ser contatado se nenhuma linha útil ou nenhum novo arquivo tiver sido depositado.

Isso pode economizar tempo para descobrir o que exatamente deu errado com alguns depósitos, o que o aproxima muito mais de ter relatórios atualizados mais cedo.

[Ebook] Quatro casos de uso para aproveitar a análise de log de SEO

Saiba como os arquivos de log, como a única referência confiável para o tráfego do site, podem fornecer respostas fáceis para perguntas difíceis de SEO.
Download de graça

Ferramentas do gerenciador de logs

Já que estamos no tópico de logs, parece apropriado mencionar que o relatório Log Manager Tools é outra grande área da plataforma que muitas vezes não é utilizada com a frequência que poderia ser. É um pequeno hub bem escondido no nível do projeto que é composto com os detalhes sobre o que exatamente está sendo depositado, em relação aos arquivos de log.

Ao entrar, você não apenas verá os arquivos exatos que foram depositados, mas também a data e hora exatas de cada depósito, a divisão de cada tipo de linha de log (OK, filtrada, errônea), um gráfico que monitora a quantidade de acertos de bot falsos detectados por data de depósito, e você pode ver um detalhamento da qualidade dos logs depositados e a distribuição de linhas úteis.

É um ótimo lugar para verificar a qualidade dos depósitos de arquivos, por exemplo, certificando-se se os arquivos estão compactados, se você está realmente depositando linhas relacionadas a SEO, como em visitas orgânicas e acessos de bots, e verificando a frequência dos depósitos.

Se você começar a notar algo estranho em seus relatórios de log, um ótimo lugar para começar sua investigação é nas Ferramentas do Log Manager. Você pode descobrir que o formato da linha de log foi alterado e nossa equipe de sucesso do cliente precisa atualizar o analisador, ou talvez você perceba que o nome do bucket mudou e você precisa nos enviar novas credenciais. De qualquer forma, você sempre pode dar uma olhada e entrar em contato conosco se precisar de ajuda para aprofundar.

Segmentações personalizadas

Por último, mas não menos importante, nossa mais recente adição ao nosso arsenal, Segmentações Personalizadas! Agora temos uma coleção de modelos de segmentação para inspirar os novatos no Oncrawl que nunca trabalharam em uma segmentação ou para tornar o desenvolvimento de uma um pouco mais fácil.

Rápida execução nas segmentações, elas são essenciais para o desenvolvimento, pois você deseja saber qual parte do site você está visualizando ao inspecionar os resultados do rastreamento. Eles podem ser tão simples quanto agrupar páginas pelo primeiro caminho no URL ou podem ser tão específicos quanto agrupar páginas por um intervalo de sessões do GA.

Além dos modelos que agora fornecem algumas orientações sobre por que você deve usá-lo, você também terá vários modelos disponíveis de acordo com os conectores de dados externos configurados para o projeto.

Portanto, se você tiver dados de log, terá uma sugestão de modelo para visitas de SEO ou hits de bot e, se tiver o Google Search Console conectado, verá a opção de criar uma segmentação com base em posições ou páginas de classificação.

Você decide como deseja visualizar o site, estamos aqui para facilitar um pouco. Então vá em frente, dê uma chance e diga-nos o que você pensa.

Comece seu teste gratuito de 14 dias

Descubra você mesmo porque Oncrawl é a plataforma de SEO técnico e de dados mais reconhecida do mercado! Sem necessidade de cartão de crédito e sem compromisso: apenas 14 dias de uma avaliação completa.
Comece seu teste