HTTP 상태 코드의 SEO 영향 및 최적화 방법

게시 됨: 2021-03-30

OnCrawl을 사용한 HTTP 상태 코드 분석은 기술 SEO 감사의 필수적인 부분입니다. 이를 통해 몇 번의 클릭만으로 사이트 구조 내에서 오류 코드를 파악할 수 있습니다. 이 HTTP 상태 코드가 실제로 예상한 코드인지 확인하고 필요한 경우 수정 사항을 적용하고 내부 연결을 수정하기만 하면 됩니다.
이 기사에서는 주요 HTTP 상태 코드의 SEO 영향과 이 코드를 최대한 활용하기 위해 사용을 최적화하는 방법을 설명합니다. 계속하기 전에 HTTP 상태 코드와 그 의미에 대한 기사를 읽을 수 있습니다.

HTTP 상태 코드 200

200 OK

서버에 대한 요청이 성공하고 모든 것이 정상입니다. 문제의 페이지는 Google 봇 및 기타 검색 엔진에서 크롤링할 수 있습니다(robots.txt에 의해 차단되지 않은 경우).

그러나 이것이 이 페이지에 필요한 조치가 없고 HTTP 상태 코드가 예상되는 코드임을 의미하지는 않습니다. 어떤 경우에는 오류가 있거나 존재하지 않는 페이지가 SEO 관점에서 최적이 아니지만 200으로 응답할 수 있습니다.

이러한 페이지는 OnCrawl에서 다음과 같은 몇 가지 기준을 조합하여 식별할 수 있습니다.

  • 분류되지 않은 분류 페이지가 포함된 기타 그룹에 표시됩니다.
  • 매우 낮은 단어 수
  • 일치하지 않는 표준 태그
  • 매우 높은 유사도
  • 최적화되지 않은 제목 및 설명 태그
  • 중복된 H1, 제목, 설명 태그
  • H1이 없는 페이지

이 잘못된 페이지에 대한 기사의 나머지 부분에서 볼 수 있듯이 내부 링크에서 해당 페이지를 제거해야 할 뿐만 아니라 SEO에 더 유용한 상태 HTTP 코드로 응답하도록 하는 것이 좋습니다.

모범 사례:

  • 색인을 생성하려는 페이지가 200으로 응답하는지 확인하십시오.
  • 200에 응답하는 페이지가 내부 링크 및 크롤링 예산을 제어하기 위해 "실제" 페이지인지 확인하십시오.

HTTP 3XX 상태 코드

301 영구 이사

요청한 페이지가 이동되어 다른 URL로 영구적으로 리디렉션되었습니다. SEO에서 매우 유용한 영구 리디렉션을 사용하면 모든 유형의 사이트 마이그레이션 사례(도메인 변경, https로의 http 마이그레이션, 재설계 등)를 관리할 수 있지만 특히 들어오는 트래픽을 잃지 않고 페이지의 URL을 수정할 수 있습니다.
Google 봇은 더 이상 원본 페이지에 액세스할 수 없으며 리디렉션을 따라 대상 페이지를 검색합니다. 페이지가 이동되었으며 원본 페이지가 더 이상 크롤링되지 않아야 함을 이해합니다.
SEO에 대한 결과:

  • 결국 원본 페이지의 색인이 제거됩니다.
  • 대상 페이지는 인덱싱되지만 원본 페이지의 위치를 ​​복구한다는 보장은 없습니다.
  • 원본 페이지에서 수신한 백링크의 SEO 주스가 대상 페이지로 전송됩니다.

이 마지막 요점은 마이그레이션 또는 단순히 사이트 콘텐츠 업데이트의 맥락에서 SEO 전략의 필수 자산입니다. Google에서 동일하거나 유사한 콘텐츠에만 301 리디렉션을 설정하여 홈 페이지로 자동 리디렉션하지 않도록 권장하는 경우 원본 페이지에서 수신하는 백링크를 고려해야 합니다. 페이지가 존재하지 않거나 더 이상 존재하지 않지만 흥미로운 백링크를 수신하는 경우 적어도 301을 설정하는 것이 좋습니다. 유사한 콘텐츠가 없는 경우 다음을 수행하여 홈 페이지에서 우선적으로 상위 페이지로 리디렉션해야 합니다. 사이트의 트리 구조(경로 경로나 URL의 폴더를 기반으로 할 수 있음). 예를 들어 제품 페이지의 경우 홈 페이지가 아닌 제품 목록으로 리디렉션됩니다.

사이트의 내부 연결에 대한 논리가 다릅니다. HTTP 301 상태 코드의 페이지를 가리키는 모든 링크를 수정하는 것이 바람직하지만 SEO 주스가 전송된다는 사실을 감안할 때 우선 순위를 지정하지 마십시오. 반면에 200에서 응답하지 않는 페이지를 가리키는 모든 리디렉션은 우선 순위로 처리되어야 합니다.

모범 사례:

    • 대상 페이지가 200에서 응답하는지 확인하십시오. OnCrawl을 사용하면 200에서 페이지를 가리키지 않는 리디렉션 및 리디렉션을 쉽게 감지할 수 있습니다.
    • 301의 페이지를 가리키는 올바른 링크
    • 모든 4XX 오류를 홈 페이지로 자동 리디렉션하여 301 사용을 제한합니다.
    • 유사한 콘텐츠가 없는 리디렉션의 경우 홈페이지보다 상위 섹션을 선호합니다.
    • 다음과 같은 경우 리디렉션을 설정합니다.
      • 콘텐츠가 이동됨
      • 유사한 콘텐츠가 원본 페이지를 대체합니다.
      • 페이지가 삭제되었지만 흥미로운 백링크를 수신합니다.

302 발견

요청한 페이지가 일시적으로 다른 URL로 리디렉션됩니다. 영구 301 리디렉션과 마찬가지로 임시 302 리디렉션은 원활한 사용자 환경으로 들어오는 트래픽을 유지하지만 동일한 SEO 이점을 제공하지는 않습니다. Google 봇은 원본 페이지에 일시적으로 액세스할 수 없음을 이해하고 다시 액세스할 것입니다.
SEO에 대한 결과:

  • Google 봇은 계속해서 원본 페이지 크롤링을 시도합니다.
  • 원본 페이지는 인기를 유지할 것입니다.
  • 넷링크의 SEO 주스는 대상 페이지로 전송되지 않습니다
  • 원본 페이지는 색인이 생성되지 않습니다(페이지가 색인화되지 않은 경우 302에서 응답하는 한 오래되지 않음)

따라서 내부 연결 내에서 302를 수정할 필요는 없지만 크롤링 또는 로그를 사용하여 구조에서 감지된 302가 실제로 일시적인지 정기적으로 확인하는 것이 좋습니다.

모범 사례:

  • 예를 들어 유지 보수와 같은 일시적인 필요에 대해서만 302를 사용하십시오.
  • 이동되었거나 영구적으로 삭제된 콘텐츠에는 302를 사용하지 마세요.
  • 영구적인 경우 302를 301로 교체합니다.

304 수정되지 않음

요청한 페이지는 마지막 상담 이후 수정되지 않았습니다. 문제의 페이지는 캐시 버전을 사용하는 Google 봇에 의해 다시 크롤링될 필요가 없습니다. 이 HTTP 304 상태 코드는 잘 알려져 있지 않지만 크롤링 예산을 절약할 수 있는 가능성을 제공합니다. Google 봇은 캐시된 버전을 사용하고 요청된 페이지에 즉시 액세스합니다.
SEO에 대한 결과:

  • 페이지가 다시 크롤링되지 않아 리소스 및 크롤링 예산이 소모되지 않습니다.
  • 페이지 로딩 시간 개선(캐시 버전)

"클래식" 페이지에 대해 이러한 유형의 응답을 구현하는 것은 어려울 수 있으며 개발이 필요할 수 있습니다. 반면에 CSS 유형의 리소스 페이지의 경우 정말 빠른 승리가 될 수 있습니다.

모범 사례:

  • 수정되지 않은 페이지의 경우 304에서 200을 선호합니다.
  • 리소스 페이지에 대한 관행을 일반화할 가능성을 연구합니다.

HTTP 4XX 상태 코드

404 파일을 찾을 수 없음

서버가 요청한 URL에 대한 페이지를 찾지 못했습니다. 이는 해당 페이지가 존재하지 않음을 의미합니다. 이는 일시적이거나 영구적일 수 있으며 일반적으로 작동하지 않는 링크를 통해 또는 사용자가 잘못된 URL을 입력하여 페이지에 액세스할 수 있습니다.
SEO에 대한 결과:

  • Google 봇은 이 페이지가 존재하지 않으며 색인이 생성되지 않아야 함을 이해합니다.
  • 페이지가 이미 색인이 생성된 경우 색인이 해제됩니다.
  • 페이지가 색인 해제되면 네트링크의 SEO 주스가 손실됩니다.

SEO에서 무슨 수를 써서라도 수정해야 하는 오류로 종종 보이는 HTTP 404 상태 코드는 실제로 SEO에 매우 유용합니다. Google이 더 이상 존재하지 않는 잘못된 URL이나 콘텐츠를 색인화하는 것을 방지합니다(이 경우 HTTP 410 코드가 더 효과적이라는 것을 나중에 알게 되겠지만). Google은 이 주제에 대해서도 명확하며 404는 문제가 되지 않습니다. 반대로 잘못된 URL이 사이트의 실제 페이지로 간주되는 것을 방지합니다.

좋은 사용자 경험을 제공하려면 다음과 같은 사용자 지정 404 오류 페이지를 만드는 것이 좋습니다.

  • 페이지가 존재하지 않음을 명시적으로 나타냅니다.
  • 귀하의 사이트 디자인에 통합되어 있습니다.
  • 액세스 가능한 콘텐츠에 대한 링크 제공
  • 인덱싱할 수 없음(404 응답 및 메타 로봇 ​​noindex)

개인화된 404 페이지에 있는 링크는 내부 링크로 계산됩니다. 404를 가리키는 사이트의 모든 링크를 수정하여 메뉴 및 바닥글 링크의 이점을 위해 내부 인기가 희석되는 것을 피하고 크롤링 예산을 낭비하지 않는 것이 좋습니다.

좋은 습관 :

    • 다음과 같은 경우 404를 설정합니다.
      • 페이지가 존재하지 않습니다(더 이상 존재하지 않는 경우 410 사용).
      • 페이지에 중요한 백링크가 없습니다.
      • 사용 가능한 동등한 콘텐츠가 없습니다
    • 사용자 지정 404 페이지 만들기
    • soft-404, 즉 HTTP 200 상태 코드로 응답하는 개인화된 404 페이지를 피하십시오.
    • 301을 사용하여 404를 체계적으로 리디렉션하지 마십시오.
    • robots.txt를 통해 404 페이지에 대한 액세스를 차단하지 마십시오.
    • 404를 가리키는 모든 링크 수정

410화

요청한 페이지는 더 이상 사용할 수 없습니다. HTTP 404 상태 코드와의 차이점은 이 미묘함에 있습니다. 페이지는 이미 존재했지만 제거되었으며 교체되지 않습니다. 따라서 Google 봇에 전송되는 메시지가 더 정확하고 확실합니다.
SEO에 대한 결과:

  • Google은 해당 정보를 지체 없이 고려합니다(404와 다름).
  • 페이지는 (거의) 즉시 색인이 해제됩니다.
  • Google은 페이지가 실제로 더 이상 존재하지 않는지 확인하도록 지정합니다.

따라서 페이지의 색인을 빠르게 제거하려는 경우 HTTP 410 상태 코드가 404보다 선호됩니다. 그러나 오류의 경우 더 많은 결과를 초래하는 HTTP 코드 상태이기도 합니다.

페이지의 색인을 해제하는 수동 방법이 있으며 삭제된 페이지에 대한 410 응답을 구현하면 프로세스를 자동화할 수 있습니다. 사용자 경험이 사용자 지정 404에서처럼 보장되지 않기 때문에 410에서 응답하는 페이지를 가리키는 링크가 없는지 확인하는 것도 중요합니다.

모범 사례:

  • 삭제된 페이지의 색인을 해제하려면 410에서 404를 선호합니다.
  • robots.txt를 통해 410 페이지에 대한 액세스를 차단하지 마십시오.
  • 410을 가리키는 모든 링크 수정

OnCrawl로 조치 취하기

크롤링 보고서로 사이트의 HTTP 상태 코드 식별

크롤링 보고서 > 색인 생성 가능성 > 상태 코드 보고서로 이동하여 HTTP 상태 코드에 따른 페이지 분석을 확인하세요.

다음 보고서를 사용하면 상태 코드 및 세그먼트별로 분류하여 작업의 우선 순위를 지정할 수 있습니다.

검색하려는 데이터를 클릭하여 csv 형식으로 내보냅니다.

더 나아가 액세스 로그를 통해 상태 코드를 검색할 수도 있습니다.

LOG MONITORING > 탐색 온전성 보고서로 이동하여 Google 봇이 발견한 HTTP 상태 코드에 따른 페이지 분석을 확인하십시오.


내부 연결 수정

내부 링크를 수정하려면 HTTP 상태 코드 200으로 응답하지 않는 페이지를 가리키는 링크를 찾아야 합니다. 원본 페이지, 앵커 및 대상 페이지의 HTTP 상태 코드가 필요합니다.

데이터 탐색기로 이동하여 링크 데이터 세트를 선택하고 다음 쿼리를 작성합니다.

이제 csv로 내보내기만 하면 됩니다.
301의 경우 리디렉션 페이지도 알고 싶다면 301 URL, 이전 URL 및 새 URL을 가리키는 모든 링크를 나열하는 파일을 만드는 방법에 대한 기사를 참조하세요.

무료 평가판 시작