SEO를 위한 패싯 필터 최적화

게시 됨: 2019-11-26

패싯 검색은 제품 목록이 포함된 페이지가 많은 사이트에서 반복적으로 발생하는 문제입니다. 올바르게 구현된 경우 패싯 검색은 사이트에 매우 유용할 수 있습니다. 실제로 새롭고 보다 구체적인 페이지를 만들면 검색 결과의 가시성을 높이기 위해 더 많은 검색 쿼리에 응답할 수 있습니다.
논리적 사이트 아키텍처 및 최적화된 내부 연결을 제공하는 것 외에도 패싯 탐색을 통해 사용자는 원하는 제품을 빠르게 찾을 수 있습니다.

패싯 검색의 구현은 특정 규칙을 따라야 합니다. 그렇지 않으면 불필요한/중복된 페이지의 대량 생성 또는 스파이더 트랩의 출현과 같은 큰 문제로 이어질 수 있습니다.

패싯이란 무엇입니까?

패싯 검색은 일반적으로 전자 상거래 또는 부동산 사이트의 목록 페이지에서 찾을 수 있습니다. 이러한 유형의 검색은 사용자가 검색을 구체화하기 위해 선택할 수 있는 다양한 특성 조합을 나타냅니다.

Zalando의 남성용 티셔츠에 대한 패싯 탐색의 예

사용 가능한 조합 중에서 패싯과 필터를 구별하는 것이 중요합니다.

패싯: 크롤링이 가능하고 인덱싱이 가능한 필터링된 카테고리 페이지입니다. 특정 검색량을 가진 사용자의 쿼리에 해당하며 그 생성은 사이트에 가치와 잠재적인 트래픽을 가져옵니다.

필터: 사용자에 대해서만 필터링된 카테고리 페이지입니다. 월간 검색량이 있는 검색어에는 일치하지 않습니다. 사용자는 카테고리 페이지를 보다 정확하게 만들고 제품의 다양한 속성을 탐색할 수 있습니다.

왜 패싯을 생성합니까?

위에서 언급했듯이 패싯 탐색은 제품/속성 목록이 있는 페이지가 많은 사이트에 유용합니다. 최적으로 관리되는 패싯 전략에는 3가지 주요 이점이 있습니다.

  • 일반 또는 롱테일 키워드를 타겟팅합니다. 따라서 특정 요청을 대상으로 하는 패싯을 만들고 해당 속성 목록을 제안하는 것은 흥미로운 일입니다.
    1. 티셔츠: 월간 검색량 74,000건
    2. 남성용 티셔츠: 월간 검색량 9,900개
    3. 남성용 블랙 티셔츠: 월간 검색량 590건
  • 특정 규칙에 따라 페이지 생성 자동화: 해당 사이트에는 일반적으로 많은 페이지가 있으므로 페이지 생성을 자동화하는 것이 유리합니다.
  • 자동 생성을 통해 이러한 페이지의 내부 연결을 자동화합니다.

생성할 패싯을 선택하는 방법은 무엇입니까?

생성할 가장 유익한 패싯을 선택하려면 3단계를 따르는 것이 중요합니다.

의미 연구: 사이트와 관련된 키워드를 수집하기 위한 고전적 의미 연구;

분류: 패싯(예: 가격, 크기, 브랜드, 성별, 재료 등)을 분류하는 다양한 관련 방법을 고려하는 일반적인 방법에 따라 키워드 분류

결과 분석: 다양한 범주와 가능한 조합을 강조하는 피벗 테이블을 사용하여 의미론적 연구 결과를 분석합니다. 아이디어는 가능한 각 교차와 관련된 검색량을 결정하는 것입니다.

예를 들어 T-셔츠 범주에서 일부 색상에 대한 패싯을 만드는 것이 좋습니다.

크롤링 및 인덱싱: 패싯 생성을 제어해야 하는 이유는 무엇입니까?

패싯 탐색이 올바르게 구현되면 사용자 및 봇에 대한 적격 페이지 수가 증가하지만 그렇지 않은 경우 여러 유형의 문제가 발생할 수 있습니다.

  • 거미 함정의 위험:

스파이더 트랩은 사이트가 올바르게 탐색되는 것을 방해하는 매우 많은 수 또는 무제한의 URL을 생성하는 것입니다. 패싯 탐색을 사용하면 중요한 조합을 많이 만들 수 있으므로 제대로 관리하지 않으면 거미 함정으로 쉽게 이어질 수 있습니다.

  • 크롤링 폐기물:

사이트 구조에서 인덱싱할 수 없는 링크가 많으면 크롤링 낭비가 불가피합니다(장기적으로는 이러한 링크가 덜 크롤링되더라도).

  • 내부 인기의 희석:

사이트 구조 내에 크롤링할 수 없는 링크가 많으면 내부 인기도가 분산될 수 있습니다.

  • 중복 또는 거의 중복 콘텐츠 생성:

패싯 검색에 의해 자동으로 생성된 일부 페이지에는 동일하거나 매우 유사한 콘텐츠가 있습니다. 내부 중복 콘텐츠를 생성하지 않도록 방지해야 합니다.

  • 빈 페이지 생성:

유사한 콘텐츠가 있는 페이지와 마찬가지로 콘텐츠가 없는 페이지는 생성되어서는 안 됩니다.

패싯 생성을 제어하기 위해 따라야 할 규칙

여러 패싯 관리

먼저 여러 변수를 동시에 선택하는 경우 패싯을 생성해야 하는지 여부를 정의해야 합니다(동일한 범주 내이든 아니든).

예: 성별 + 색상 패싯 만들기
예: 남성용 + 아동용이 선택된 경우 성별 패싯을 생성 하지 마십시오 .
예: 성별 + 패턴 패싯을 만들지 마십시오 .

제품/상품의 최소 수량 정의

상품/상품의 수가 충분한 경우에만 패싯이 자동으로 생성되어야 합니다.

예: 판매할 티셔츠가 3개 이상 있는 경우 성별(남성 또는 여성) 패싯 생성

텍스트 : 카테고리 페이지 남성용 패싯 여성용 패싯 남성용 티셔츠가 3개 이상 있습니다. 여성용 티셔츠가 3개 없습니다.

텍스트:
카테고리 페이지
남성의 패싯
여성의 면
남성용 티셔츠가 3개 이상 있습니다.
3 여성용 티셔츠가 없습니다 .

SEO 태그 설정

생성된 패싯에는 고전적인 SEO 최적화 태깅이 포함되어야 하므로 자동 태깅 규칙을 정의해야 합니다.

텍스트:
남성용 + 레드
남성용 + M
성별 : 남성, 여성, 아동
색상 : 블루, 그린, 레드
성별 : 남성, 여성, 아동
사이즈 : XS, S, M

패싯 H1 타이틀 규칙 설명 규칙
성별 + 색상 [성별] [색상] 티셔츠 [성별] [색상] 티셔츠 – 마이 브랜드 Mysite.com에서 ➤ [성별] [색상] 티셔츠를 모두 만나보세요! 무료 배송 ✚ 1,500가지 스타일!
성별 + 크기 [성별] [사이즈] 티셔츠 [성별] [사이즈] 티셔츠 – 마이 브랜드 Mysite.com에서 ➤ [성별] [크기] 티셔츠를 모두 만나보세요! 무료 배송 ✚ 1,500가지 스타일!

URL 재작성 설정

패싯은 처음에 인덱싱하려는 필터이므로 인덱싱을 위해 열릴 때 "추한" URL이 생성됩니다. 그런 다음 "깨끗한" URL을 얻기 위해 이러한 URL을 다시 작성해야 합니다(즉, %, ? 또는 &와 같은 특수 문자 제외).

예: Nike검은색 티셔츠를 찾고 있습니다.

이러한 "깨끗한" URL은 크롤링 및 인덱싱에 최적화되어 있습니다.

URL 안정성 관리

URL 구조는 사용자가 따라가는 경로에 따라 변경되지 않아야 합니다.

예: 두 사람이 검은색 Nike 브랜드 티셔츠를 찾고 있지만 다른 방식입니다.

따라서 [의류 카테고리] > [색상] > [브랜드]와 같이 기본 순서를 정의하고 사용자의 경로에 관계없이 이 순서를 유지해야 합니다.

내부 연결 최적화

기존 사이트 구조와 마찬가지로 열린 패싯을 크롤링하고 인덱싱할 수 있으려면 사이트의 URL에 열린 패싯에 대한 영구 링크가 있어야 합니다. 후자는 DOM에 있어야 하며 JavaScript 및 CSS가 비활성화된 경우에도 액세스할 수 있어야 합니다.

예: 남성용 + 컬러 티셔츠용 패싯이 생성되었습니다.

Men's blue t-shirts 내 남성용 빨간색 티셔츠 페이지에서 내 남성용 티셔츠로 연결되는 <a href =”https://mysite.com/t-shirts/mens/blue”> 남성용 파란색 티셔츠 패싯에 액세스할 수 없도록 하는 여러 가지 방법

패싯 생성과 관련하여 따라야 할 규칙에 대해 논의했으므로 이제 생성되어서는 안 되는 패싯을 크롤링/인덱싱할 수 없도록 만드는 방법을 정의해야 합니다.

일반적으로 원치 않는 패싯을 여러 가지 방법으로 차단할 수 있으며 각각 장단점이 있습니다.

  • 원치 않는 패싯 링크에 nofollow 추가 + 메타 로봇 ​​noindex

이 솔루션은 원치 않는 페이지의 크롤링 낭비를 제한하고 닫힌 페이지가 인덱싱되지 않도록 합니다(다른 방법으로 검색 엔진에 알려진 경우). 그러나 페이지에 크롤링할 수 없는 링크가 많이 있기 때문에 내부 인기도 희석 문제가 해결되지 않습니다.

  • 원치 않는 페이지에 메타 로봇 ​​noindex 추가

이 접근 방식을 사용하면 인덱싱 및 중복 콘텐츠 문제만 해결됩니다. 사실, 크롤링 낭비와 내부 인기의 희석은 여전히 ​​사이트에 존재합니다.

  • robots.txt로 패싯 차단

robots.txt로 원하지 않는 패싯의 패턴을 차단하여 설정이 간편한 솔루션입니다. 이 옵션을 사용하면 쓸모 없는 페이지에 크롤링 예산을 낭비하지 않을 수 있지만 인덱싱, 중복된 콘텐츠 및 내부 인기도 저하와 관련된 솔루션은 제공하지 않습니다.

  • JS / 아약스

Javascript/Ajax를 사용하여 패싯을 차단하면 모든 문제를 효율적으로 해결할 수 있습니다. 실제로 원치 않는 패싯에 대한 링크는 사용자만 액세스할 수 있으며 페이지의 소스 코드에는 없으므로 로봇이 액세스할 수 없습니다. Google은 Javascript를 실행하며 이 솔루션의 이상적인 구현은 클라이언트 측에서 수행됩니다. 카테고리 페이지 필터링은 브라우저에서 직접 발생해야 하며 새 페이지는 생성되지 않습니다.

  • PRG(Post-Redirect-Get): JS/Ajax를 사용하는 것처럼 이 방법을 사용하면 모든 문제를 효율적으로 해결할 수 있습니다. 참고로 GET 요청을 사용하면 정보가 URL로 전송되고 Google에서 실행할 수 있습니다. 반면에 POST 요청의 경우 정보가 양식에 포함되며 Google에서 실행할 수 없습니다.

따라서 PRG 방법의 목적은 원하지 않는 패싯에 대해 POST 모드에서 양식을 사용하여 Google이 이를 실행하지 않도록 하는 것입니다. 이것은 다음을 산출합니다:

1단계 POST: 사용자가 원치 않는 패싯의 필터를 클릭하면 요청이 POST 방식으로 전송됩니다.

2단계 REDIRECT: 서버는 필터링된 URL로 리디렉션하여 요청에 응답합니다.

3단계 GET: 리디렉션을 따르고 필터링된 URL이 GET 메서드와 함께 반환됩니다. 사용자는 필터링된 결과를 봅니다.

[사례 연구] 패널티 후 웹사이트 재설계 모니터링 및 최적화

알고리즘 업데이트에 따른 막대한 손실을 복구하기 위해 Opirata는 대규모 사이트 재설계를 시작했습니다. Opirata가 OnCrawl의 크롤러 및 로그 분석기를 사용하여 이전 사이트의 함정을 이해하고, SEO 가설을 검증하고, Google이 변경 사항을 고려하면서 진행 상황을 추적하기 위해 어떻게 이점을 얻었는지 알아보십시오.
사례 연구 읽기

요약

결론적으로

패싯 생성을 원활하게 수행하려면 몇 가지 규칙을 따르고 사전 프로덕션 설정에서 가능한 모든 경우에 대해 계획해야 합니다. 패싯 관리는 사이트에서 사용되는 CMS에 따라 다르며 패싯 생성 및 제한을 관리하는 다양한 솔루션이 있으며 각각 장단점이 있습니다.