Linkowanie wewnętrzne: jak określić najważniejsze strony do linkowania?

Opublikowany: 2021-05-03

Jeśli linki zewnętrzne (backlinki) są jednym z obszarów poprawy, o którym często wspomina się, aby poprawić SEO, linkowanie wewnętrzne jest często pomijane, ale jest również ważne. W rzeczywistości dobra struktura powiązań wewnętrznych może mieć ogromne znaczenie w bardzo konkurencyjnych sektorach.

Jeśli w przypadku małej witryny zdefiniowanie najważniejszych stron, do których należy utworzyć łącze, może być stosunkowo łatwym zadaniem, co z witrynami z tysiącami, a nawet milionami stron?

W dzisiejszym artykule wyjaśnię metodologię, którą możesz zastosować w swoim projekcie w celu określenia stron priorytetowych.

N-gramowa analiza naszych słów kluczowych

Po pierwsze, musimy zrozumieć, jakie słowa kluczowe są najczęściej używane do wyszukiwania naszego produktu lub usługi. Jeśli kiedykolwiek otwierałeś raport Google Search Console, prawdopodobnie zauważyłeś, że może istnieć wiele struktur słów kluczowych. Na przykład w przypadku zakupu lotu między dwoma różnymi miastami, weźmy Lyon i Barcelona, ​​wyszukiwania mogą wyglądać następująco:

  • Lot lyon barcelona
  • Lot lyon barcelona
  • Tanie loty do lyon barcelona
  • Itp.

Taka mnogość struktur słów kluczowych nie jest charakterystyczna dla branży turystycznej i prawdopodobnie masz podobną sytuację w swojej branży.

Jednak aby móc poprawnie przeprowadzić naszą analizę, niezbędna jest wiedza, które struktury są najczęściej używane. Jak możemy to zrobić? Po prostu wykonując analizę n-gramów (sekwencji N słów używanych jako słowo kluczowe) naszych własnych danych Google Search Console.

Zanim wyjaśnię, jak to zrobić, wyjaśnię jedną rzecz: niestety dane Google Search Console nie są idealne.

[Studium przypadku] Jak zorientowane na biznes SEO zwiększa ruch i konwersje

Dzięki zwycięskiej strategii SEO skupiającej się na zarządzaniu zduplikowanymi treściami, ulepszaniu struktury witryny i analizowaniu zachowań Googlebota, Carwow rozwinęła się jako firma. Dowiedz się, jak pokazać rzeczywiste wyniki strategii SEO opartej na biznesowym ROI.
Przeczytaj studium przypadku

Ograniczenia

Zanim rozpoczniemy naszą analizę, musimy mieć świadomość, że dane wyświetlane przez narzędzie po uwzględnieniu wymiaru „zapytanie” stanowią tylko 30-50% (dokładna liczba będzie zależeć od Twojej witryny) łącznej wyświetlanej, jeśli uwzględnisz na przykład wymiar „strona”.

Innymi słowy: narzędzie cierpi na próbkowanie wymiarowe. Oznacza to, że dane zwracane przez Google Search Console będą się różnić w zależności od tego, co analizujesz (zapytania, strony…). Należy również zaznaczyć, że dane te uzyskałem za pomocą API, tj. poprzez interakcję ze wszystkimi dostępnymi danymi, a nie przez znany wszystkim interfejs, który pozwala na analizę maksymalnie 1000 elementów.

Jeśli pracujesz z Pythonem, możesz przeczytać oficjalną dokumentację Google lub, jeszcze lepiej, skorzystać z tej biblioteki, która zaoszczędzi Ci dużo czasu. Sam go używam regularnie.

To powiedziawszy, Google Search Console jest wciąż bardziej wyczerpujące niż jakiekolwiek inne narzędzie innych firm, takie jak SEMrush, SEObserver, Ahrefs lub Sistrix, by wymienić tylko te najbardziej znane.

Metodologia uzyskiwania n-gramów

Aby uzyskać n-gramy, musisz wykonać następującą procedurę:

Pobierz swoje dane Google Search Console

Ważne jest, aby pobrać dane dla jednej branży. Ponieważ n-gramy sekcji Lot i sekcja Pociąg w Twojej witrynie prawdopodobnie będą się różnić, jeśli połączysz swoje dane, możesz uzyskać n-gramy ważne tylko dla najczęściej wyszukiwanej branży.

Jeśli Twoja witryna jest nowa lub rzadko pojawia się na pierwszej stronie, polecam skorzystać z dodatkowego źródła danych.

Usuń zmienne

W niektórych przypadkach może być konieczne usunięcie niektórych elementów tych słów kluczowych. Załóżmy na przykład, że moja lista zawiera tylko 4 słowa kluczowe:

  • Lot Paryż Rzym
  • Tanie loty Paryż Rzym
  • Lot lyon barcelona
  • Tanie loty do lyon barcelona

Chcę otrzymać n-gramy w postaci struktur zawierających zmienne. Tutaj na przykład chcę zachować tylko: lot {{origin}} {{destination}} i tani lot {{origin}} {{destination}} , bez miast. W Twoim przypadku może być konieczne zastąpienie nazwy produktów, rozmiaru itp. Będzie to zależeć od Twojej branży.

Oblicz n-gramy i pobierz liczby wyszukiwań

Możesz użyć dowolnego systemu: w moim przypadku używam Pythona, który ma tę zaletę, że jest prosty i może obsłużyć ilość danych, które mamy na zwykłym komputerze (bez jego awarii).

 #importuj biblioteki
importuj kolekcje
importuj nltk
importuj numer jako np
importuj pandy jako PD

#utwórz listę unikalnych słów kluczowych
list_of_keywords = raport['zapytanie'].tolist()

#utwórz listę słów zawartych w tych słowach kluczowych
list_of_words_in_keywords = [x.split(" ") for x in list_of_keywords]

#policz najczęstsze
liczniki = kolekcje.Licznik()
dla frazy w list_of_words_in_keywords:
  counts.update(nltk.ngrams(fraza, 1))
  counts.update(nltk.ngrams(fraza, 2))

Możesz także użyć natywnej funkcji Oncrawl, aby przeanalizować swoje treści i odkryć niektóre n-gramy, które nie pojawiają się w Google Search Console (jeszcze).

Następnie musisz pobrać woluminy wyszukiwania dla każdej z tych struktur, aby uzyskać tabelę podobną do poniższej. Ta tabela przedstawia najczęstsze struktury: te, które mają największą liczbę wyświetleń w naszej branży.

zapytanie liczyć wrażenia
Lot {początek} {miejsce docelowe} 50 167000
Tanie loty {origin} {destination} 676 30000
Bilet {pochodzenie} {miejsce docelowe} 300 97000

Dobra robota, żeby przejść do tego etapu. Mogę powiedzieć, że chcesz wiedzieć, do czego wykorzystamy te informacje. Odpowiedź znajduje się w następnej części

[Studium przypadku] Jak zorientowane na biznes SEO zwiększa ruch i konwersje

Dzięki zwycięskiej strategii SEO skupiającej się na zarządzaniu zduplikowanymi treściami, ulepszaniu struktury witryny i analizowaniu zachowań Googlebota, Carwow rozwinęła się jako firma. Dowiedz się, jak pokazać rzeczywiste wyniki strategii SEO opartej na biznesowym ROI.
Przeczytaj studium przypadku

Wyodrębnianie tomów wyszukiwania

Pamiętajmy, że naszym celem jest zdefiniowanie najważniejszych stron, do których linkujemy w pierwszej kolejności.

Aby zrozumieć, które strony mają największy potencjalny ruch, musimy pobrać liczbę operacji wyszukiwania różnych najpopularniejszych struktur słów kluczowych dla każdej strony. Uwzględnimy tutaj tylko liczbę wyszukiwań; pojęcie CTR pojawi się później!

Czy zaczynasz rozumieć, do czego służył poprzedni krok? W celu zwiększenia wydajności korzystanie z API jest obowiązkowe. Istnieje wiele rozwiązań, z których większość to rozwiązania płatne. Jeśli korzystasz z DataForSEO, pozyskanie wolumenów dla 350 000 słów kluczowych będzie kosztować mniej niż 40 €, więc nie mówimy również o znaczącej inwestycji.

Na końcu tego kroku będziesz miał plik z potencjalną ilością na adres URL. Jest to suma objętości najpopularniejszych n-gramów obliczonych w poprzednim kroku.

Scalanie danych

Na tym etapie oczywiście nie możemy wykorzystać tych danych do priorytetyzacji najważniejszych stron naszej witryny. Dlaczego nie?

Nie mieszajmy natężenia ruchu z ruchem!

W niektórych przypadkach, nawet jeśli jesteś na pierwszym miejscu, Twój CTR może być nadal niski. Często jest to spowodowane liczbą reklam i funkcji SERP wyświetlanych przez Google nad Twoją stroną. Oto przykład zapytania o pogodę, w którym pierwszy element Google silnie przyciąga uwagę użytkownika na długo przed osiągnięciem przez niego pierwszego organicznego wyniku.

Ograniczenia n-gramów

Znaczenie słów kluczowych z długim ogonem może się różnić w zależności od sektora. Struktury, które nie zostałyby zachowane w pierwszym kroku (lub zostały ukryte przez Google Search Console), mogą jednak stanowić interesującą część potencjału. Dlatego musimy je uwzględnić.

Znaczenie każdej strony

Jako ekspert SEO naszym celem nie jest generowanie ruchu, ale generowanie sprzedaży za pośrednictwem wyszukiwarek. Dlatego bardzo ważne jest, jeśli to możliwe, uzupełnienie tej analizy danymi z Twojego działu sprzedaży. Na przykład dane dotyczące marży sprzedaży mogą pomóc w ustaleniu, którym adresom URL należy nadać priorytet.

Weźmy tabelę z końca poprzedniego kroku i dodajmy inne dane, które mogą być przydatne do pomiaru:

  • Potencjalna ekspozycja (objętość/wyświetlenia)
  • Rzeczywisty ruch (sesje / kliknięcia)
  • Przychody (współczynnik konwersji/marża/przychody)

Oto przykład, jak zaprezentować tę tabelę:

Ważenie danych

Aby sklasyfikować każdy inny element treści pod kątem jego potencjalnej ekspozycji, potencjalnego ruchu i przychodów, musisz zdecydować, jaką wagę przypisać każdemu z tych elementów.

Nie mogę zaproponować standardowych procentów; to do Ciebie należy określenie procentów, które będą pasować do Twojej sytuacji.

Normalizacja

Należy pamiętać, że nie możemy jeszcze określić ważności każdej z naszych stron. Wynik, który uzyskujemy poprzez ważenie danych, które uzyskaliśmy wcześniej, nie jest jeszcze aktualny.

Wyjaśnienie: z definicji wyświetlenia będą wyższe niż kliknięcia i sesje. Dotyczy to zwłaszcza branż o niskim CTR. Bez wcześniejszego przetwarzania naszych danych ryzykujemy przeważenie wyświetleń (i niedoważenie sesji).

Jak rozwiązujemy ten problem? Poprzez standaryzację naszych danych! Ten proces pozwala nam na zmianę rozmiaru zmiennych liczbowych tak, aby były porównywalne na wspólnej skali (źródło). Dzięki manipulacji matematycznej nasz rozkład danych ilościowych będzie miał średnią wartość 0 i odchylenie standardowe równe 1.

Jeśli jesteś ciekawy, wzór matematyczny wygląda następująco:

X_standard = wartość znormalizowana
X = wartość początkowa
μ = średnia (średnia) naszego rozkładu
σ = odchylenie standardowe naszego rozkładu

Zastosowanie tej formuły do ​​swoich danych jest bardzo proste:

Zastosuj tę formułę do wszystkich danych, które chcesz uwzględnić w obliczeniach. To z pewnością wyeliminuje problem przeważenia metryki.

Obliczanie wyniku

Po zdefiniowaniu wag i obliczeniu standardowych wartości możesz przypisać ocenę każdemu ze swoich adresów URL, aby określić jego wagę. W tym przykładzie mamy 4 metryki, z których każda ma taką samą wagę 25%, ale oczywiście możesz użyć innych liczb.

Ta metodologia pozwala zatem na umieszczenie na pierwszym miejscu adresu URL, który jest obiektywnie najlepszy: mniejsza liczba wyszukiwań, ale wysoka liczba wyświetleń, a przede wszystkim imponujący CTR.

Dzięki tym informacjom będziesz w stanie zdefiniować swoją wewnętrzną strukturę linków w znacznie bardziej kompleksowy i odpowiedni sposób, niż gdybyś opierał ją na jednym kryterium, takim jak liczba wyszukiwań. Od Ciebie zależy, czy chcesz połączyć:

  • Ze strony głównej: najważniejsze strony
  • Z kategorii: najważniejsze strony z danej kategorii
  • I tak dalej.

Wniosek

Metodologia n-gramów jest wydajna i ma tę zaletę, że można ją zastosować w wielu projektach. Wystarczy go dostosować, wykorzystując najważniejsze dane z Twojej branży. Pomimo zastosowania koncepcji matematycznej, która dla niektórych może być nowa (standaryzacja), łatwo jest ją wyjaśnić i zastosować w praktyce za pomocą narzędzi, którymi dysponujesz.

Dostarczy Ci informacji niezbędnych do zbudowania wewnętrznej siatki w oparciu o potencjał i wyniki Twoich stron. Zadanie, które czasami jest trudne do wykonania w przypadku dużych witryn.

Wystarczy go zastosować!