리디렉션 체인 및 루프를 처리하는 가장 좋은 방법

게시 됨: 2018-11-28

11월 20일 "루프 및 체인 리디렉션" 웨비나에서 OnCrawl의 고객 성공 관리자인 Erle Alberton은 OnCrawl을 사용 하여 웹사이트에서 리디렉션을 관리 하는 다양한 방법을 제시했습니다 .

리디렉션이란 무엇입니까?

리디렉션은 페이지의 콘텐츠를 다른 URL에서 찾을 수 있음을 나타내는 HTTP 상태 코드입니다 . 여기에는 다음과 같은 특정 리디렉션 코드가 포함됩니다.

  • 301: 영구 리디렉션
  • 302: 임시 리디렉션
  • 307: 브라우저가 이전 URL에 대한 요청과 정확히 동일한 새 URL에 대한 새 요청을 발행하도록 강제하는 임시 리디렉션

참고: OnCrawl은 수백만 개의 사이트를 크롤링한 후 Google이 임시 기간이 종료되었는지 여부를 계속 확인하기 위해 302 리디렉션이 상당한 크롤링 예산을 소비한다는 것을 관찰했습니다. 크롤링 예산을 최적화하려는 경우 대신 301 리디렉션을 사용해 보세요.

Google은 리디렉션을 어떻게 처리합니까?
Google에 따르면 리디렉션은 사이트 수명 주기의 일부입니다. 그들은 PageRank를 목표로 전송하고 체인에 나타나지 않는 한 문제를 일으키지 않습니다.

“IMO SEO는 리디렉션에 대해 너무 많이 고민합니다. 작업에 적합한 것을 사용하십시오. SEO 문제가 아니라 기술적인 문제입니다. 부두 마법이 아니야."
— 존 뮬러

"모든 리디렉션이 이제 PageRank를 통과합니다."
— 게리 일리스

"우리는 체인에서 최대 5개의 [리디렉션]을 추적하지만(리디렉션 체인을 가능한 한 짧게 유지하십시오), 동시에 원하는 만큼 사이트의 URL을 리디렉션할 수 있습니다."
— Google 웨비나 중 설명

그러나 OnCrawl의 데이터에 따르면 Google 크롤러가 뒤따르는 최대 리디렉션 수가 16개 정도인 경우가 많습니다.

사슬이란 무엇이며 무엇이 사슬을 일으킬 수 있습니까?

리디렉션은 자체적으로 다른 URL로 리디렉션되는 대상 URL을 가리킬 때 체인이 됩니다.

다음과 같은 경우 체인이 발생할 수 있습니다.

  • 기사 제목을 수정했을 때 URL이 기사 제목을 기반으로 하는 경우
    원본 URL -> 제목 수정 -> 새 URL 2로 리디렉션 -> 제목 수정 -> URL 3으로 리디렉션

    • 상황: 제목을 수정할 때마다 CSM이 자동 리디렉션을 생성할 수 있습니다. 또는 htaccss 파일에서 수정 사항에 대한 규칙을 수동으로 설정하는 경우 이전 규칙이 파일에 남아 있을 수 있습니다.
    • 조언: 새 규칙을 생성하려면 항상 현재 상태로 시작한 다음 URL 3을 직접 가리키도록 모든 이전 규칙을 수정하십시오.

  • 웹사이트를 여러 번 재설계한 후
    원본 URL -> 재설계 -> URL 2 -> 재설계 -> URL 3…

    • 일어난 일: 웹사이트를 재설계할 때 htaccess 파일에 리디렉션 규칙을 작성합니다. 몇 달 후 사이트의 일부가 다시 디자인되었습니다. 새 규칙이 htaccess 파일의 이전 규칙에 추가되어 일련의 리디렉션이 생성됩니다.

  • HTTPS로 마이그레이션 또는 도메인 이름 변경
    http URL(www 제외) -> http URL(www 포함) -> https URL(www 제외) -> https URL(www 포함)
    http URL(www 제외) -> https URL(www 제외) -> https URL(www 포함)
    http URL(www 포함 또는 제외) -> http URL(이전 슬러그) -> http URL(새 슬러그) -> https URL(새 슬러그)
    http URL(www 포함 또는 제외) -> https URL(이전 슬러그) -> https URL(새 슬러그)

    • 상황: URL이 규칙에 따라 올바른 URL로 리디렉션됩니다. 종종 여기에는 HTTP에서 HTTPS로 리디렉션하기 전 및/또는 후에 자동(www 하위 도메인의 경우)이든 아니든(URL 수정 규칙을 추가한 경우) 리디렉션 단계가 포함됩니다.

루프란 무엇이며 루프는 어떻게 생성됩니까?

리디렉션 루프는 닫힌 리디렉션 체인입니다. 체인의 링크 중 하나가 이미 동일한 체인의 일부인 URL로 리디렉션됩니다. 루프에서 불가피한 약 20번의 리디렉션 후에 사용자는 페이지를 볼 수 없습니다.

OnCrawl에서 사용할 수 있는 통계는 무엇입니까?

크롤링 보고서에서 OnCrawl은 웹사이트 리디렉션 주제에 대한 5가지 주요 차트를 제공합니다. 차트는 인덱싱 가능성, 상태 코드에서 찾을 수 있습니다.

1. 전체 사이트에 대한 HTTP 상태 코드 분석

이 차트는 OnCrawl에서 한동안 사용되었으며 웹사이트에서 리디렉션된 페이지의 비율(상태 코드 3xx)을 추적할 수 있습니다.

2. 모든 리디렉션을 요약한 표

각 리디렉션 유형에 대해 이 테이블은 연결된 페이지 수를 제공하며 더 중요한 것은 리디렉션 루프 또는 체인의 페이지를 가리키는 링크 수입니다.

리디렉션에는 여러 유형이 있습니다.

  • 단일 리디렉션: 추가 리디렉션이 발생하지 않는 URL A에서 URL B로의 단순 리디렉션 입니다. 단순 리디렉션은 SEO에 문제를 일으키지 않습니다. 이전 URL을 가리키는 백링크가 있는 경우 이전 URL에서 받은 PageRank를 보존하는 데 사용할 수 있습니다. 리디렉션의 "잘못된" 부분을 가리키는 내부 링크에 주의하십시오. 대상 URL을 가리키도록 업데이트해야 합니다.
  • 3xx 체인의 페이지: 2개 이상의 리디렉션 시리즈 . 이러한 리디렉션은 처음부터 끝까지 평가됩니다. 관련된 페이지 수와 체인의 모든 부분을 가리키는 링크 수를 찾을 수 있습니다. 숫자를 클릭하면 숫자가 나타내는 URL 목록을 찾을 수 있습니다. 그런 다음 최종 URL을 가리키도록 수정하는 것은 귀하에게 달려 있습니다.
  • 리디렉션이 너무 많은 3xx 체인의 페이지 . OnCrawl은 500개의 리디렉션 후에 체인 탐색을 중지합니다!
  • 3xx 루프 내부의 페이지 : 체인의 페이지 중 하나가 체인의 다른 페이지로 리디렉션될 때 루프가 생성됩니다. 결과적으로 이 일련의 리디렉션에는 최종 페이지가 없습니다.
  • 3xx 최종 타겟인 페이지: 리디렉션의 타겟이지만 다른 페이지로 리디렉션되지 않는 페이지. 최종 대상 페이지를 크롤링할 수 없는 경우 이 숫자에 포함되지 않습니다. 특정 페이지에서 크롤러를 금지하는 구체적인 이유를 확인할 수 있습니다.

3. 리디렉션 후 최종 상태 차트

이 차트를 통해 다음 질문에 답할 수 있습니다. OnCrawl이 루프 또는 체인의 모든 단계에 대한 크롤링을 완료하면 최종 대상 페이지의 상태는 무엇입니까?

차트는 가능한 다양한 답변을 보여줍니다.

  • 200: 마지막 페이지가 제대로 작동합니다.
  • 3xx(외부): 최종 페이지가 다른 사이트에 있지만 리디렉션되기도 함
  • 4xx: 마지막 페이지를 찾을 수 없습니다.
  • 5xx: 마지막 페이지에서 서버 오류를 반환합니다.
  • 크롤링되지 않음: OnCrawl 봇이 최종 페이지에 도달하지 못했습니다. 페이지가 크롤링에 포함되지 않은 하위 도메인에 있거나 페이지가 robots.txt 파일에서 로봇 거부로 나열될 수 있습니다.

3xx, 4xx 및 5xx에서 최종 페이지를 수정하는 것은 매우 가치가 있습니다.

4xx 및 5xx(오류 페이지)로 시작하여 3xx의 페이지로 이동하십시오(이것은 체인 및 루프의 일부인 페이지입니다).

4. 페이지 그룹 및 깊이별 상태 코드 분석

이 차트는 페이지 그룹 또는 페이지 깊이별로 볼 수 있습니다. 페이지 그룹 기반 버전을 사용하면 OnCrawl 메트릭을 기반으로 페이지를 그룹화할 수 있는 OnCrawl의 세분화를 사용할 수 있습니다.

몇 가지 예:

  • 순위가 지정되거나 순위가 지정되지 않은 페이지에 대한 세분화 사용
  • 순위가 지정되지 않은 페이지 중 4xx 또는 5xx를 반환하는 비율은 얼마입니까?
  • GSC의 노출수를 기반으로 한 세분화
  • 노출수가 없고 상태가 200이 아닌 최종 도착 페이지가 있는 체인의 영향을 받는 페이지가 있습니까?

두 번째 탭에서는 웹 사이트의 페이지 깊이에 따라 상태 코드를 볼 수 있습니다. 일반적으로 페이지의 위치가 깊을수록 리디렉션 수가 많아집니다.

5. 페이지 그룹 및 깊이에 따른 체인 또는 루프의 페이지 분류

이 차트는 선택한 세분화에 맞게 조정됩니다.

이 차트는 깊이별로 볼 수도 있으므로 리디렉션 루프 및 체인과 관련된 페이지의 위치를 ​​​​볼 수 있습니다.

리디렉션을 관리하기 위해 수행할 작업

  • 1. 영향을 받는 페이지 나열
    루프 및 체인의 최종 대상 페이지입니다. 이렇게 하면 크롤러가 수정하거나 접근하지 못하도록 해야 할 페이지에 대한 좋은 아이디어를 얻을 수 있습니다.
    최우선 순위: 루프의 페이지. 루프는 수정해야 할 가장 중요한 요소입니다.
    최우선 순위: 리디렉션이 너무 많은 체인의 페이지. 루프와 마찬가지로 너무 긴 체인을 수정하는 것이 최우선입니다.

  • 2. 영향을 받는 페이지에 대한 링크 변경
    링크는 체인의 최종 페이지를 가리키도록 업데이트하거나 링크가 크롤링되지 않도록 "nofollow"로 설정할 수 있습니다.
    상황에 따른 우선 순위: 체인의 최종 대상 페이지에 대한 링크. 이렇게 하면 크롤러가 수정하거나 ..
    최우선 순위: 루프에 있는 페이지에 대한 링크. 루프는 수정해야 할 가장 중요한 요소입니다.
    최우선 순위: 리디렉션이 너무 많은 체인의 페이지에 대한 링크. 루프와 마찬가지로 너무 긴 체인을 수정하는 것이 최우선입니다.
    우선순위 2: 체인에 있는 페이지에 대한 링크.
    우선 순위 3: 최종 대상에 대한 단일 리디렉션이 있는 페이지에 대한 링크입니다.

리디렉션의 영향을 받는 페이지 또는 링크를 나열하는 방법은 무엇입니까?

OnCrawl에서 메트릭을 클릭하면 클릭한 정보에 대한 세부 정보를 볼 수 있는 사전 설정된 필터가 있는 데이터 탐색기로 직접 전환됩니다.

예를 들어 루프에 있지 않지만 리디렉션이 너무 많은 체인에 있는 페이지 수를 클릭하면 이 기준을 충족하는 모든 URL을 나열하는 보고서로 바로 이동합니다. 예를 들어 루프에 있는 모든 페이지를 표시하도록 필터를 조정할 수 있습니다.

마찬가지로 페이지를 가리키는 모든 링크를 탐색할 수 있습니다. 예를 들어 리디렉션된 모든 페이지의 경우 "3xx 오류를 가리키는 페이지" QuickFilter는 리디렉션된 페이지를 가리키는 모든 링크를 표시합니다.

OnCrawl API를 사용하는 경우 교차 요청을 사용하여 페이지를 가리키는 링크를 나열하는 방법도 있습니다. 여기에서 자세히 설명하지 않겠지만 리디렉션 유형, 앵커 및 전달하는 주스의 양에 따라 모든 링크를 얻을 수 있습니다.

크롤링을 실행하지 않고 사이트에서 리디렉션을 테스트하는 방법은 무엇입니까?

크롤링을 실행하기 전에도 리디렉션에 대한 초기 진단을 받을 수 있습니다.

크롤링하기 전에 시작 URL을 테스트하는 것이 좋습니다. OnCrawl은 크롤링 설정에 시작 URL을 입력하는 즉시 자동으로 시작 URL을 확인합니다. 시작 URL이 유효하지 않은 경우 다음과 같은 다양한 이유 때문일 수 있습니다.

시작 URL이 200의 페이지로 리디렉션됨 – 시작 URL이 400의 페이지로 리디렉션됨 – 시작 URL이 확인되지 않은 체인의 일부임

  • 시작 URL이 리디렉션됩니다. 이 경우는 조금 특별할 수 있습니다. Erle의 경우 웹사이트를 크롤링해야 하는 경우 항상 도메인의 URL에서 시작합니다. OnCrawl이 이 URL이 "리디렉션된 것 같습니다..."라고 말하더라도 그는 이 경우에 사이트를 분석하는 데 매우 유용하기 때문에 이 URL을 계속 사용할 것입니다. 리디렉션된 시작 URL의 경우에 나타나는 경고는 오류가 아닙니다. 추가 정보일 뿐입니다.
  • 시작 URL이 오류를 반환합니다 . 반면에 오류를 반환하는 페이지로 리디렉션되는 시작 URL을 입력할 수 있습니다. 이 경우 크롤러는 더 이상 진행할 수 없습니다.
  • 시작 URL은 루프의 일부입니다. 이 경우 OnCrawl은 크롤링이 불가능함을 알려줍니다. OnCrawl은 이미 루프의 일부이기 때문에 첫 번째 URL의 최종 대상을 결정할 수 없습니다.

더 나아가

올바른 세분화로 리디렉션 분석

"상태 코드 분석"
SEO 최적화는 항상 더 많은 노출을 얻을 수 있는 페이지의 가능성으로 시작됩니다. GSC의 노출 범위를 기반으로 세분화를 적용하면 지난 45일 동안 GSC에서 노출이 0인 페이지를 볼 수 있습니다. 이를 통해 이러한 페이지 중 일부가 3xx 및 4xx로 응답함을 발견할 수 있습니다.

물론 다른 세분화를 통해 데이터의 추가 특성을 더 잘 볼 수 있습니다.

"아니요. 3xx 체인 또는 루프 내부의 페이지 수"
이 차트는 영향을 받는 페이지 수에 대한 개요를 제공합니다. 다시 말하지만, 사용하는 탭에 따라 그룹 또는 깊이별로 구성됩니다.

그룹별로 리디렉션 루프 및 체인의 영향을 가장 많이 받는 그룹 유형을 한 눈에 알 수 있습니다.

다른 탭으로 전환하면 루프와 체인에 어떤 깊이 페이지가 나타나는지 확인할 수 있습니다. 그러나 우리가 깊이를 보고 있다고 해서 세분화를 사용할 수 없다는 의미는 아닙니다.

OnCrawl에서 기본적으로 제공되는 URL 기반 세분화가 있는 경우 페이지 상단의 두 번째 필터를 사용하여 세분화의 특정 페이지 그룹을 대상으로 합니다. 그런 다음 이 차트를 사용하여 이 그룹의 페이지에 대한 사이트 구조의 깊이 분석을 볼 수 있습니다.

사이트 깊숙이 있지 않은 페이지는 깊숙한 페이지보다 인덱싱될 가능성이 더 높다는 점을 기억하십시오. 위의 전략은 SEO 작업의 우선 순위를 정하기 위해 사이트에서 가장 중요한 그룹과 사이트 구조에서 가장 높은 위치에 있는 페이지에 초점을 맞추는 데 도움이 됩니다.

보고서 및 세분화 조정

OnCrawl은 메트릭을 기반으로 합니다. 모든 OnCrawl 메트릭과 마찬가지로 리디렉션 분석과 관련된 메트릭은 데이터 탐색기에서 사용할 수 있습니다.

보고서에 다음 데이터를 추가할 수 있습니다.
– 리디렉션 대상
– 체인 끝까지의 거리(리디렉션 수)
– 페이지가 리디렉션이 너무 많은 체인의 일부인지 여부 표시
– 페이지가 리디렉션 루프의 일부인지 여부 표시
– 클러스터의 ID 번호입니다. 동일한 클러스터의 일부인 모든 페이지는 동일한 리디렉션 체인 또는 루프에서 발견됩니다.
– 체인의 최종 대상 페이지 및 해당 HTTP 상태

이러한 메트릭을 사용하여 OnCrawl 세분화를 생성할 수도 있습니다. 예를 들어, 이를 통해 체인의 리디렉션 수에 따라 페이지를 그룹화하거나 작거나 큰 리디렉션 체인을 타겟팅할 수 있습니다. 우리는 또한 체인 끝으로부터의 거리에 따라 페이지의 특성을 볼 수 있습니다: 1 리디렉션, 2-5 리디렉션, 6-10, 11-20, 20 이상…

"URL 세부 정보"에서 리디렉션의 시각적 표현을 확인하십시오.

URL 세부 정보 탐색기에는 페이지의 리디렉션 체인에 대한 정보가 포함되어 있습니다.

데이터 탐색기에서 URL을 클릭하면 리디렉션 정보를 비롯한 자세한 내용을 볼 수 있습니다.

URL 세부 정보 페이지에는 이 페이지의 리디렉션과 관련된 다양한 데이터가 있습니다. 리디렉션 체인의 시각적 표현도 있습니다. 이 시각적 개체에는 다음이 포함됩니다.
– 체인의 시작
– 체인 내 각 페이지의 상태
– 체인의 최종 대상(녹색)
– 현재 URL

이 시각적 개체는 루프에도 사용할 수 있습니다. 페이지 상태 코드와 리디렉션 경로는 체인과 동일한 방식으로 표시됩니다.

몇 가지 모범 사례

웨비나에서 Erle는 다음과 같은 조언을 제공했습니다.

  • 체인의 각 URL은 최종 URL로 리디렉션되어야 합니다!
  • 체인의 URL에 대한 각 링크는 최종 URL을 가리켜야 합니다!
  • 먼저 루프를 수정합니다. 그런 다음 4xx 및 5xx 오류를 수정합니다.
  • 사이트 구조에서 가능한 한 높은 시작 URL로 크롤링을 설정하십시오.
  • 재설계 또는 마이그레이션을 수행할 때 htaccess에 있는 100개의 리디렉션 규칙을 사용하는 크롤링 구성을 만들고 정기적으로(일주일에 한 번) 크롤링을 실행하여 리디렉션 정책이 여전히 적용되는지 확인합니다.
  • 일련의 리디렉션을 하나의 단일 리디렉션으로 잘라야 합니다(백링크를 잊지 마세요!).

상위 SEO는 리디렉션에 대한 모범 사례를 추가하기 위해 Twitter 토론에 참여했습니다.

OnCrawl에서 리디렉션에 대한 자세한 정보를 찾는 방법은 무엇입니까?

이 웨비나의 슬라이드는 Slideshare(프랑스어)에서 볼 수 있습니다.

이 기능에 관심이 있다면 OnCrawl에서 표준 크롤링의 일부로 포함되어 있습니다. 기능이 출시된 후 크롤링을 실행하기만 하면 됩니다.

아직 OnCrawl 계정이 없다면? 걱정 마세요. 지금이 무료 평가판을 시작하기에 완벽한 시간입니다!

무료 평가판 시작