내부 링크: 링크할 가장 중요한 페이지를 결정하는 방법은 무엇입니까?

게시 됨: 2021-05-03

외부 링크(백링크)가 SEO 개선을 ​​위해 자주 언급되는 개선 영역 중 하나인 경우 내부 링크는 종종 간과되지만 중요합니다. 사실, 우수한 내부 연결 구조는 경쟁이 치열한 부문에서 모든 차이를 만들 수 있습니다.

소규모 사이트의 경우 가장 중요한 페이지를 먼저 정의하는 것이 상대적으로 쉬운 작업이라면 수천 또는 수백만 페이지의 사이트는 어떻습니까?

오늘 기사에서는 우선 순위 페이지를 결정하기 위해 프로젝트에 적용할 수 있는 방법론을 설명하겠습니다.

우리 키워드의 N-gram 분석

먼저 제품이나 서비스를 검색할 때 가장 많이 사용되는 키워드를 이해해야 합니다. Google Search Console 보고서를 열어 본 적이 있다면 많은 키워드 구조가 존재할 수 있다는 것을 알았을 것입니다. 예를 들어, 두 도시 간 항공편 구매의 경우 리옹과 바르셀로나를 예로 들어 보겠습니다. 검색은 다음과 같습니다.

  • 플라이트 리옹 바르셀로나
  • 플라이트 리옹 바르셀로나
  • 저렴한 항공편 리옹 바르셀로나
  • 등.

이러한 복수의 키워드 구조를 갖는 것은 여행 산업에만 국한되지 않으며, 아마도 당신의 산업에서도 비슷한 상황이 있을 것입니다.

그러나 분석을 올바르게 수행하려면 어떤 구조가 가장 많이 사용되는지 아는 것이 중요합니다. 어떻게 하면 될까요? 자체 Google Search Console 데이터의 n-gram 분석(키워드로 사용되는 N 단어 시퀀스)을 수행하기만 하면 됩니다.

이 작업을 수행하는 방법을 설명하기 전에 한 가지만 명확히 하겠습니다. 불행히도 Google Search Console 데이터는 완벽하지 않습니다.

[사례 연구] 비즈니스 지향 SEO가 트래픽과 전환을 증가시키는 방법

중복 콘텐츠 관리, 사이트 구조 개선, Googlebot 행동 분석에 중점을 둔 성공적인 SEO 전략 덕분에 carwow는 비즈니스로 성장했습니다. 비즈니스 ROI를 기반으로 SEO 전략의 실제 결과를 표시하는 방법을 알아보세요.
사례 연구 읽기

제한 사항

분석을 시작하기 전에 "쿼리" 측정기준을 포함할 때 도구에 표시되는 측정항목은 포함할 경우 표시되는 총계의 30-50%(정확한 수치는 사이트에 따라 다름)만 나타냅니다. 예를 들어 "페이지" 차원입니다.

즉, 도구는 차원 샘플링 문제가 있습니다. 즉, Google Search Console에서 반환하는 측정항목은 분석 대상(쿼리, 페이지 등)에 따라 다릅니다. 또한 이 데이터는 최대 1000개의 요소만 분석할 수 있는 모두에게 친숙한 인터페이스 대신 API를 사용하여, 즉 사용 가능한 모든 데이터와 상호 작용하여 얻은 것임을 지적해야 합니다.

Python으로 작업하는 경우 공식 Google 문서를 읽거나 더 나은 방법으로 이 라이브러리를 사용하여 많은 시간을 절약할 수 있습니다. 나는 그것을 정기적으로 스스로 사용합니다.

그렇긴 해도 Google Search Console은 SEMrush, SEObserver, Ahrefs 또는 Sistrix와 같은 다른 타사 도구보다 여전히 더 철저합니다.

n-gram을 얻기 위한 방법론

n-gram을 얻으려면 다음 절차를 따라야 합니다.

Google Search Console 데이터 다운로드

단일 카테고리에 대한 데이터를 다운로드하는 것이 중요합니다. 사이트의 Flight 섹션과 Train 섹션의 n-gram이 다를 수 있으므로 데이터를 혼합하면 가장 많이 검색된 카테고리에만 유효한 n-gram을 얻을 수 있습니다.

사이트가 신규이거나 첫 페이지에 거의 표시되지 않는 경우 추가 데이터 소스를 사용하는 것이 좋습니다.

변수 제거

경우에 따라 이러한 키워드에서 일부 요소를 제거해야 할 수도 있습니다. 예를 들어 내 목록에 4개의 키워드만 포함되어 있다고 가정해 보겠습니다.

  • 비행 파리 로마
  • 저렴한 비행 파리 로마
  • 플라이트 리옹 바르셀로나
  • 저렴한 항공편 리옹 바르셀로나

변수를 포함하는 구조의 형태로 n-gram을 얻고 싶습니다. 예를 들어 여기에서는 도시 없이 항공편 {{origin}} {{destination}}저렴한 항공편 {{origin}} {{destination}} 만 유지하고 싶습니다. 귀하의 경우 제품 이름, 크기 등을 바꿔야 할 수도 있습니다. 업종에 따라 다릅니다.

n-gram 계산 및 검색량 검색

원하는 시스템을 사용할 수 있습니다. 제 경우에는 단순하다는 장점이 있고 일반 컴퓨터에 있는 데이터 양을 충돌 없이 처리할 수 있는 Python을 사용합니다.

 #라이브러리 가져오기
컬렉션 가져오기
수입품
numpy를 np로 가져오기
pandas를 pd로 가져오기

#고유한 키워드 목록 만들기
list_of_keywords = 보고서['쿼리'].tolist()

#이 키워드에 포함된 단어 목록을 만듭니다.
list_of_words_in_keywords = [x.split(" ") for x in list_of_keywords]

#가장 흔한 것을 세어라
카운트 = 컬렉션.카운터()
list_of_words_in_keywords의 구문:
  counts.update(nltk.ngrams(구, 1))
  counts.update(nltk.ngrams(구, 2))

또한 Oncrawl의 기본 기능을 사용하여 콘텐츠를 분석하고 Google Search Console(아직)에 표시되지 않는 일부 n-gram을 발견할 수 있습니다.

그런 다음 각 구조에 대한 검색량을 검색하여 아래와 같은 테이블을 가져와야 합니다. 이 표는 가장 일반적인 구조를 보여줍니다. 즉, 카테고리에 대한 노출수가 가장 높은 구조입니다.

질문 세다 노출수
항공편 {출발지} {목적지} 50 167000
저렴한 항공편 {origin} {destination} 676 30000
티켓 {origin} {destination} 300 97000

이 단계까지 가길 잘했다. 저희가 이 정보를 무엇에 사용할지 알고 싶다고 말씀드릴 수 있습니다. 답은 다음편에 있다

[사례 연구] 비즈니스 지향 SEO가 트래픽과 전환을 증가시키는 방법

중복 콘텐츠 관리, 사이트 구조 개선, Googlebot 행동 분석에 중점을 둔 성공적인 SEO 전략 덕분에 carwow는 비즈니스로 성장했습니다. 비즈니스 ROI를 기반으로 SEO 전략의 실제 결과를 표시하는 방법을 알아보세요.
사례 연구 읽기

검색량 추출

우리의 목표는 가장 먼저 링크할 가장 중요한 페이지를 정의하는 것임을 기억합시다.

잠재적인 트래픽이 가장 높은 페이지를 이해하려면 각 페이지에 대해 가장 일반적인 다양한 키워드 구조의 검색량을 검색해야 합니다. 여기서는 검색량만 고려합니다. CTR의 개념은 나중에 나옵니다!

이전 단계가 무엇을 위한 것인지 이해하기 시작했습니까? 효율성을 얻으려면 API 사용이 필수입니다. 대부분 유료 솔루션인 많은 솔루션이 존재합니다. DataForSEO를 사용하는 경우 350,000개의 키워드에 대한 볼륨을 얻는 데 40€ 미만의 비용이 들므로 상당한 투자에 대해서도 이야기하고 있지 않습니다.

이 단계가 끝나면 URL당 잠재적 볼륨이 있는 파일이 생성됩니다. 이것은 이전 단계에서 계산된 가장 일반적인 n-그램의 부피의 합입니다.

데이터 병합

이 단계에서는 이 데이터를 사용하여 사이트에서 가장 중요한 페이지의 우선 순위를 지정할 수 없습니다. 왜 안 돼?

볼륨과 트래픽을 혼동하지 맙시다!

어떤 경우에는 귀하가 1순위에 있더라도 CTR이 여전히 낮을 수 있습니다. 이는 종종 귀하의 페이지 위에 Google이 표시하는 광고 및 SERP 기능의 수 때문입니다. 다음은 사용자가 첫 번째 유기적 결과에 도달하기 훨씬 전에 첫 번째 Google 요소가 사용자의 관심을 강하게 끄는 날씨 쿼리의 예입니다.

n-그램의 한계

롱테일 키워드의 중요성은 업종에 따라 다를 수 있습니다. 그럼에도 불구하고 첫 번째 단계에서 유지되지 않았을(또는 Google Search Console에 의해 숨겨져 있는) 구조는 잠재력의 흥미로운 부분을 나타낼 수 있습니다. 그러므로 우리는 그것들을 포함시켜야 합니다.

각 페이지의 중요성

SEO 전문가로서 우리의 목표는 트래픽을 생성하는 것이 아니라 검색 엔진을 통해 판매를 생성하는 것입니다. 따라서 가능하다면 영업 부서의 데이터를 사용하여 이 분석을 완료하는 것이 중요합니다. 예를 들어 판매 마진에 대한 데이터는 우선 순위를 지정해야 하는 URL을 결정하는 데 도움이 될 수 있습니다.

이전 단계의 끝에서 표를 가져와 측정하는 데 유용할 수 있는 다른 데이터를 추가해 보겠습니다.

  • 잠재적 노출(볼륨/노출수)
  • 실제 트래픽(세션/클릭)
  • 수익(전환율/마진/수익)

다음은 이 표를 표시하는 방법의 예입니다.

데이터 가중치 부여

잠재적인 노출, 잠재적인 트래픽 및 수익에 따라 콘텐츠의 각기 다른 부분을 분류하려면 이러한 각 요소에 가중치를 둘 것인지 결정해야 합니다.

표준 백분율을 제안할 수 없습니다. 자신의 상황에 맞는 백분율을 정의하는 것은 사용자의 몫입니다.

표준화

아직 각 페이지의 중요성을 정의할 수는 없습니다. 이전에 얻은 데이터에 가중치를 주어 얻은 결과는 아직 유효하지 않습니다.

설명: 정의에 따라 노출수는 클릭수 및 세션수보다 높습니다. 이는 CTR이 낮은 산업에서 특히 그렇습니다. 사전에 데이터를 처리하지 않으면 노출 수에 가중치를 부여하고 세션에 가중치를 두지 않을 위험이 있습니다.

이 문제를 어떻게 해결합니까? 데이터를 표준화함으로써! 이 프로세스를 통해 수치 변수의 크기를 조정하여 공통 척도(소스)에서 비교할 수 있습니다. 수학적 조작을 통해 우리의 정량적 데이터 분포는 평균 값이 0이고 표준 편차가 1이 됩니다.

궁금하시다면 수학 공식은 다음과 같습니다.

X_standard = 표준화된 값
X = 초기 값
μ = 분포의 평균(평균)
σ = 분포의 표준편차

이 공식을 데이터에 적용하는 것은 매우 간단합니다.

계산에서 고려하려는 모든 데이터에 이 공식을 적용하십시오. 이것은 메트릭을 과대평가하는 문제를 확실히 제거할 것입니다.

점수 계산

가중치를 정의하고 표준화된 값을 계산한 후에는 각 URL에 점수를 할당하여 중요성을 결정할 수 있습니다. 이 예에는 4개의 측정항목이 있으며 각각 25%로 동일하게 가중치가 부여되지만 다른 숫자를 사용할 수도 있습니다.

따라서 이 방법론을 사용하면 검색량은 적지만 노출수는 높고 무엇보다도 인상적인 CTR과 같이 객관적으로 가장 좋은 URL을 먼저 배치할 수 있습니다.

이 정보를 사용하면 검색량과 같은 단일 기준을 기반으로 하는 경우보다 훨씬 더 포괄적이고 관련성 있는 방식으로 내부 연결 구조를 정의할 수 있습니다. 링크하는 것은 귀하에게 달려 있습니다:

  • 홈페이지에서: 가장 중요한 페이지
  • 카테고리에서: 해당 카테고리의 가장 중요한 페이지
  • 등등.

결론

n-gram 방법론은 효율적이며 많은 프로젝트에 적용할 수 있다는 장점이 있습니다. 업계에서 가장 중요한 데이터를 사용하여 조정하기만 하면 됩니다. 일부 사용자에게는 생소할 수 있는 수학적 개념(표준화)을 사용함에도 불구하고 사용 가능한 도구를 사용하여 설명하고 실행하는 것도 간단합니다.

페이지의 잠재력과 결과를 기반으로 내부 메쉬를 구축하는 데 필요한 정보를 제공합니다. 때로는 대규모 사이트에서 얻기가 복잡한 작업입니다.

적용만 하면 끝!