Links internos: como determinar as páginas mais importantes para vincular?

Publicados: 2021-05-03

Se os links externos (backlinks) são uma das áreas de melhoria frequentemente mencionadas para melhorar o seu SEO, os links internos são muitas vezes esquecidos, mas também são importantes. De fato, uma boa estrutura de vinculação interna pode fazer toda a diferença em setores muito competitivos.

Se, para um site pequeno, definir as páginas mais importantes para vincular primeiro pode ser uma tarefa relativamente fácil, o que dizer de sites com milhares ou até milhões de páginas?

No artigo de hoje, explicarei uma metodologia que você pode aplicar ao seu projeto para determinar as páginas prioritárias.

Análise N-gram de nossas palavras-chave

Primeiro, precisamos entender quais palavras-chave são usadas com mais frequência para pesquisar nosso produto ou serviço. Se você já abriu um relatório do Google Search Console, provavelmente notou que muitas estruturas de palavras-chave podem existir. Por exemplo, para a compra de um voo entre duas cidades diferentes, vamos pegar Lyon e Barcelona, ​​as buscas podem ser:

  • Voo Lyon Barcelona
  • Voo Lyon Barcelona
  • Voo barato lyon barcelona
  • etc.

Ter esse tipo de pluralidade de estruturas de palavras-chave não é específico para o setor de viagens e você provavelmente tem uma situação semelhante em seu próprio setor.

No entanto, é fundamental saber quais são as estruturas mais utilizadas para podermos realizar nossa análise corretamente. Como podemos fazer isso? Simplesmente realizando uma análise de n-gram (sequência de N palavras usadas como palavra-chave) de nossos próprios dados do Google Search Console.

Antes de explicar como fazer isso, deixe-me esclarecer uma coisa: infelizmente, os dados do Google Search Console não são perfeitos.

[Estudo de caso] Como o SEO voltado para negócios aumenta o tráfego e as conversões

Graças a uma estratégia de SEO vencedora com foco no gerenciamento de conteúdo duplicado, melhoria da estrutura do site e análise do comportamento do Googlebot, a carwow cresceu como negócio. Descubra como mostrar resultados reais de uma estratégia de SEO baseada no ROI do negócio.
Leia o estudo de caso

Limitações

Antes de iniciarmos nossa análise, precisamos estar cientes de que as métricas exibidas pela ferramenta quando você inclui a dimensão “consulta” representam apenas 30-50% (o valor exato dependerá do seu site) do total exibido se você incluir a dimensão dimensão “página”, por exemplo.

Em outras palavras: a ferramenta sofre de amostragem dimensional. Isso significa que as métricas retornadas pelo Google Search Console serão diferentes dependendo do que você está analisando (consultas, páginas…). De referir ainda que obtive estes dados através da API, ou seja, interagindo com todos os dados disponíveis, em vez de através da interface que todos conhecem, que só permite analisar no máximo 1000 elementos.

Se você trabalha com Python, pode ler a documentação oficial do Google ou, melhor ainda, usar esta biblioteca que economizará muito tempo. Eu mesmo uso regularmente.

Dito isto, o Google Search Console ainda é mais completo do que qualquer outra ferramenta de terceiros, como SEMrush, SEObserver, Ahrefs ou Sistrix, para citar apenas as mais conhecidas.

Metodologia para obter seus n-grams

Para obter seus n-grams, você precisa seguir este procedimento:

Baixe seus dados do Google Search Console

É importante baixar seus dados para um único vertical. Como os n-gramas de uma seção de Voo e de uma seção de Trem do seu site provavelmente serão diferentes, se você misturar seus dados, poderá obter n-gramas válidos apenas para a vertical mais pesquisada.

Se o seu site for novo ou raramente aparecer na primeira página, recomendo que você use uma fonte de dados adicional.

Remover variáveis

Em alguns casos, pode ser necessário remover alguns dos elementos dessas palavras-chave. Por exemplo, vamos supor que minha lista contenha apenas 4 palavras-chave:

  • Voo Paris Roma
  • Voo barato paris roma
  • Voo Lyon Barcelona
  • Voo barato lyon barcelona

Eu quero obter n-gramas na forma de estruturas, contendo variáveis. Aqui, por exemplo, quero manter apenas: voo {{origin}} {{destination}} e voo barato {{origin}} {{destination}} , sem as cidades. No seu caso, você pode ter que substituir o nome dos seus produtos, o tamanho, etc… Vai depender do seu setor.

Calcule n-grams e recupere volumes de pesquisa

Você pode usar o sistema que preferir: No meu caso, eu uso Python, que tem a vantagem de ser simples e pode lidar com a quantidade de dados que temos em um computador comum (sem travar).

 #importar bibliotecas
importar coleções
importar nltk
importar numpy como np
importar pandas como pd

#crie uma lista de palavras-chave exclusivas
list_of_keywords = report['query'].tolist()

#crie uma lista de palavras contidas nessas palavras-chave
list_of_words_in_keywords = [x.split(" ") para x em list_of_keywords]

#conta os mais comuns
conta = coleções.Contador()
para frase em list_of_words_in_keywords:
  counts.update(nltk.ngrams(frase, 1))
  counts.update(nltk.ngrams(frase, 2))

Você também pode usar a função nativa do Oncrawl para analisar seu conteúdo e descobrir alguns n-grams que não aparecem no Google Search Console (ainda).

Em seguida, você precisará recuperar os volumes de pesquisa para cada uma dessas estruturas, para obter uma tabela como a abaixo. Esta tabela mostra as estruturas mais comuns: aquelas que têm o maior número de impressões para nossa vertical.

consulta contar impressões
Voo {origem} {destino} 50 167000
Voo barato {origem} {destino} 676 30.000
Bilhete {origem} {destino} 300 97.000

Bom trabalho para chegar a esta fase. Posso dizer que você quer saber para que usaremos essas informações. A resposta está na próxima parte

[Estudo de caso] Como o SEO voltado para negócios aumenta o tráfego e as conversões

Graças a uma estratégia de SEO vencedora com foco no gerenciamento de conteúdo duplicado, melhoria da estrutura do site e análise do comportamento do Googlebot, a carwow cresceu como negócio. Descubra como mostrar resultados reais de uma estratégia de SEO baseada no ROI do negócio.
Leia o estudo de caso

Extraindo volumes de pesquisa

Vamos lembrar que nosso objetivo é definir as páginas mais importantes para vincular primeiro.

Para entender quais páginas têm o maior tráfego potencial, precisamos recuperar os volumes de pesquisa das diferentes estruturas de palavras-chave mais comuns, para cada página. Levaremos em consideração apenas o volume de pesquisa aqui; a noção de CTR virá mais tarde!

Você está começando a entender para que serviu o passo anterior? Para ganhar eficiência, o uso de uma API é obrigatório. Existem muitas soluções, a maioria das quais são soluções pagas. Se você usa DataForSEO, obter volumes para 350.000 palavras-chave custará menos de 40€, então também não estamos falando de um investimento significativo.

Ao final desta etapa, você terá um arquivo com o volume potencial por URL. Esta é a soma dos volumes dos n-gramas mais comuns calculados na etapa anterior.

Mesclando os dados

Nesta fase, obviamente não podemos usar esses dados para priorizar as páginas mais importantes do nosso site. Por que não?

Não vamos misturar volume e tráfego!

Em alguns casos, mesmo se você estiver na primeira posição, sua CTR ainda pode ser baixa. Isso geralmente ocorre devido ao número de anúncios e recursos SERP exibidos pelo Google acima de sua página. Aqui está um exemplo de uma consulta de previsão do tempo em que o primeiro elemento do Google atrai fortemente a atenção do usuário muito antes que ele alcance o primeiro resultado orgânico.

Limitações de n-gramas

A importância das palavras-chave de cauda longa pode variar dependendo do setor. As estruturas que não teriam sido mantidas na primeira etapa (ou estão ocultas pelo Google Search Console) podem, no entanto, representar uma parte interessante do potencial. Devemos, portanto, incluí-los.

Importância de cada página

Como especialista em SEO, nosso objetivo não é gerar tráfego, mas sim gerar vendas através dos mecanismos de busca. Portanto, é crucial, se possível, completar esta análise com os dados do seu departamento de vendas. Por exemplo, os dados sobre a margem de vendas podem ajudar a determinar quais URLs você deve priorizar.

Vamos pegar a tabela do final da etapa anterior e adicionar outros dados que podem ser úteis para medir:

  • Exposição potencial (volume/impressões)
  • Tráfego real (sessões / cliques)
  • Receita (taxa de conversão/margem/receita)

Aqui está um exemplo de como apresentar esta tabela:

Ponderando os dados

Para classificar cada conteúdo diferente de acordo com sua exposição potencial, tráfego potencial e receita, você deve decidir quanto ponderar cada um desses elementos.

Não posso propor porcentagens padrão; cabe a você definir as porcentagens que se adequam à sua própria situação.

estandardização

Observe que ainda não podemos definir a importância de cada uma de nossas páginas. O resultado que obtemos ponderando os dados que obtivemos anteriormente ainda não é válido.

Explicação: Por definição, as impressões serão maiores do que cliques e sessões. Isso é especialmente verdadeiro em setores com CTRs baixas. Sem processar nossos dados antecipadamente, corremos o risco de sobrecarregar as impressões (e sessões de ponderação insuficiente).

Como resolvemos este problema? Padronizando nossos dados! Este processo permite redimensionar as variáveis ​​numéricas para que sejam comparáveis ​​em uma escala comum (fonte). Por meio de manipulação matemática, nossa distribuição de dados quantitativos terá um valor médio de 0 e um desvio padrão de 1.

Se você está curioso, a fórmula matemática é a seguinte:

X_standard = valor padronizado
X = valor inicial
μ = média (média) da nossa distribuição
σ = desvio padrão da nossa distribuição

É muito simples aplicar esta fórmula aos seus dados:

Aplique esta fórmula a todos os dados que deseja considerar em seu cálculo. Isso definitivamente eliminará o problema de excesso de peso em uma métrica.

Calculando a pontuação

Depois de definir seus pesos e calcular seus valores padronizados, você pode atribuir uma pontuação a cada um de seus URLs para determinar sua importância. Neste exemplo, temos 4 métricas, cada uma com peso igual a 25%, mas você obviamente pode usar outros números.

Essa metodologia, portanto, permite que você coloque primeiro um URL que seja objetivamente o melhor: um volume de pesquisa menor, mas impressões altas e, acima de tudo, um CTR impressionante.

Com essas informações, você poderá definir sua estrutura de links internos de forma muito mais abrangente e relevante do que se baseasse em um único critério, como volume de buscas. Cabe a você vincular:

  • Da página inicial: as páginas mais importantes
  • De uma categoria: as páginas mais importantes da categoria em questão
  • E assim por diante.

Conclusão

A metodologia n-gram é eficiente e tem a vantagem de ser aplicável a muitos projetos. Você só precisa adaptá-lo usando os dados mais importantes do seu setor. Apesar do uso de um conceito matemático que pode ser novo para alguns (padronização), também é simples de explicar e colocar em prática com as ferramentas que você tem à sua disposição.

Ele fornecerá as informações necessárias para construir sua malha interna com base no potencial e nos resultados de suas páginas. Uma tarefa que às vezes é complexa de obter para grandes sites.

Tudo que você tem a fazer é aplicá-lo!