전문가를 위한 페이지 매김 및 정규화 – SMX Advanced 2012

게시 됨: 2012-06-07

이 기술적인 세션은 무엇에 관한 것입니까? 의제에 대한 설명은 다음과 같습니다.

선택적 매개변수, 정렬 순서 및 필터와 함께 페이지 매김 태그 사용. robots.txt 또는 noindex를 사용해야 하는 이유가 여전히 있습니까? 표준 태그가 실제로 301을 대체할 수 있습니까? 기본 페이지 이름을 정규화할 때 IIS=기반 사이트를 무한 리디렉션 루프로부터 어떻게 유지합니까? rel=alternate href=lang은 어떻습니까? 문제를 단계별로 살펴보고 사이트의 어수선함을 정리하고 크롤링 및 인덱싱을 최대화하며 중복 콘텐츠 위험을 제거할 수 있습니다.

진행자: Vanessa Fox, Search Engine Land 기고 편집자(@vanessafox)
Q&A 진행자: Eric Enge, Stone Temple Consulting CEO(@stonetemple)
스피커:
Adam Audette, RKG 사장(@audette)
Jeff Carpenter, PETCO SEO 관리자(@SanDiegoSEO)
Maile Ohye, Google Inc. 수석 개발자 프로그램 엔지니어(@maileohye)

Vanessa는 청중을 환영하며 많은 질문 시간이 있을 것이라고 말합니다. Adam Audette가 프레젠테이션을 시작합니다. 그는 괴짜에 정말 흥분합니다. 귀엽다.

페이지 매김 해야 할 것과 하지 말아야 할 것

그것에 대해 생각하는 가장 좋은 방법은 "모든 것이 가능한 한 단순해야 하지만 단순하지 않아야 합니다." – 아인슈타인

예: 대형 전자상거래 사이트인 Zales. 다양한 종류와 페이지의 제품이 있습니다. 정렬, 페이지 보기 및 페이지를 기반으로 하면 크롤링에 혼란을 줄 수 있는 많은 기회가 있습니다. 100개 이상의 중복 결과를 쉽게 얻을 수 있습니다.

큰일이야? 예, 특히 Panda 이후에는 유사 중복이 없습니다.

이것을 처리하는 방법?

Noindex 페이지 매김 방법: 페이지 noindex, 따릅니다. 문제는 크롤링하는 것입니다.
주석:
noindex로 주석이 달린 2-N 페이지, 다음
페이지 2-N 자체 참조 상대 표준
페이지 2-N에는 고유한 제목, URL 및 메타 데이터가 포함되어 있습니다.

Rel prev/next Pagination Technique: 구현하기가 조금 더 어렵습니다. noindex 일종의 형평성을 페이지 1에 전달하여 순위 후보로 지정하는 경우 rel next/prev는 페이지를 함께 시리즈로 롤링합니다.

더 깊은 페이지는 여전히 색인에 있으며 site: search를 통해 제거할 수 있으며 Google에서 관련 결과로 간주할 때 표시됩니다. rel canonical이 자체 참조인 경우 적절하지만 페이지 1을 가리키는 데 사용되는 경우 충돌 신호가 있습니다.

모든 페이지 매김 요구 사항 보기
주석:
2-N 페이지는 모두 보기를 rel canonical target으로 지정합니다.
우아한 솔루션
모두 보기 전환율이 더 높은 경향이 있습니다.

Vanessa는 제품을 표시하는 AJAX 무한 스크롤도 좋은 사용자 경험이라고 설명합니다.

Quora와 Twitter는 모두 이 작업을 지속적으로 로드하고 새로 고침하는 방법을 수행합니다. Googlebot은 처음 500단어를 가져옵니다. 콘텐츠를 크롤링하려는 경우 잠재적인 문제입니다.

권장 사항:
멋진 뷰가 있을 때 모든 것이 우아한 방법입니다.
모두 보기가 옵션이 아닌 경우 rel next/prev를 사용하십시오.
두 가지 추가 옵션: #hash를 사용하여 RL에 매개변수 추가 및 사용자가 스크롤할 때 점진적 렌더링

패싯 탐색을 위한 SEO

패싯이 선택된 경우 사용자에게는 중요하지만 SEO에는 중요하지 않거나 SEO에 중요하다고 분류합니다. 각 상황에 대해 다르게 대우하십시오. 선택 방법에 관계없이 URL에 대해 동일한 표준 경로를 적용합니다.

단점:
크롤링 오버헤드를 줄이는 데 문제가 없음
노동 집약적이고 오류가 발생하기 쉬운

Common rel canonical gotcha: 실제 표준 버전이 있을 때 표준이 아닌 자신을 참조하는 비표준의 복제. 이것은 그들이 접하는 가장 일반적인 문제입니다.

테이크아웃:
rel canonical을 사용하여 바로 가기가 아닌 선호하는 URL에 신호를 보냅니다.
내부 링크 신호는 일관되어야 합니다.
자체 참조 rel canonical 주의

다음은 제프 카펜터입니다. 그는 Petco.com에서 사례 연구를 가지고 있습니다. 분류에 따른 대량의 중복. 각 하위 범주에는 많은 개선 옵션이 있었습니다. 사이트 재설계 카테고리 재분류 및 탐색 및 URL 구조가 변경되었습니다.

해결책:
세분화 옵션을 줄입니다. 사용된 것과 사용되지 않은 개선 사항을 확인하기 위해 분석을 검토했습니다. 50개에서 12개로 변경되었습니다.
부서 간 교육. 부서 전반에 걸친 교육으로 인해 통합된 URL 형식이 광고되었습니다.
사이트에서 동적으로 생성된 탐색과 일치하도록 표준 태그를 구현합니다. 균일한 URL 형식을 생성하고 분석 데이터를 개선했습니다.
noindex를 활용하고 모든 페이지 매김 페이지를 팔로우하여 사이트 내 중복 콘텐츠 문제의 가능성을 줄입니다.

결과:
6개월 만에 자연 검색을 통한 전환율 13% 이상 증가
SERP에서 가치가 낮은 페이지의 양 감소
전체 순위 증가 - 2개월 동안 모니터링된 구문 전체에서 약 20% 향상
제품 목록 페이지로 직접 SERP 트래픽

Maile는 회의가 그녀와 그녀의 팀에 도움이 되는 피드백을 어떻게 제공했는지 설명하면서 그룹 포옹을 할 것입니다. 여기에서 말하는 것은 Google에서 그들에게 유익했습니다. 2009년에 그녀는 복제에 대한 세션을 갖고 PageRank 조각 문제를 통해 작업했습니다. 2012년 패널은 패싯 탐색 문제를 제기했습니다. 2011년에는 개선된 URL 매개변수 도구를 출시했습니다.

2011년 REI가 있는 패널은 페이지 매김 문제를 제기하여 중복되지 않은 콘텐츠에 rel canonical을 사용하려고 시도했지만 의도하지 않았습니다. Google rel next/prev 지원은 5개월 후에 출시되었습니다. Google이 스스로 감지할 수 있는 것보다 더 많은 시퀀스를 식별하는 데 도움이 됩니다.

웹마스터 도구의 URL 매개변수

그녀는 블로그 게시물과 도움말 센터 문서가 가능한 한 철저하지 못한 점에 대해 사과합니다.

매개변수를 이해하여 사이트를 보다 효율적으로 크롤링할 수 있도록 지원
사이트를 보다 효율적으로 크롤링
대역폭 절약
보다 독창적이고 신선한 콘텐츠를 색인화할 수 있습니다.
제거하려면 WMT의 URL 제거로 이동하십시오.

페이지 크롤링 후 별도로 적용되는 페이지 수준 마크업은 여전히 ​​고려 중입니다.
URL 매개변수는 유용한 힌트가 될 수 있으며 지시문이 아닙니다.

고급 기능입니다. Google에서 결정한 사이트의 크롤링 범위가 이미 높은 경우가 있습니다. 부적절한 조치로 인해 검색 결과에 페이지가 표시되지 않을 수 있습니다.

문제: 비효율적인 크롤링
사용 가능한 URL: key=value&key2=value 2

1단계: 내용을 변경하지 않는 매개변수 지정
1. 페이지 콘텐츠에 영향을 주지 않는 매개변수(sessionID, 제휴 ID, 추적 ID)가 있습니까?
"내용을 변경하지 않음"으로 표시할 가능성이 있습니다.

2a단계: 콘텐츠를 변경하는 매개변수 지정
2b단계: Googlebot의 기본 동작 지정

정렬 매개변수는 표시되는 순서 내용을 변경합니다.
1. 전체 사이트에서 정렬 매개변수가 선택 사항입니까?
2. 정렬 매개변수가 표시되지 않을 때 Googlebot이 유용한 모든 것을 검색할 수 있습니까?

둘 다 예인 경우 매개변수로 "URL 없음 크롤링"을 지정할 수 있습니다.

표시된 예가 표준이 아니며 탐색을 통해 표준에 도달할 수 있는지 확인합니다.

또는 사이트 전체에서 동일한 정렬 값을 사용합니까?
1. 모든 범주에 대해 동일한 정렬 값이 일관되게 사용됩니까?
2. 사용자가 정렬 값을 변경하면 전체 항목 수가 변경되지 않습니까?

그렇다면 정렬 매개변수를 사용하여 "값이 x인 URL만"을 지정할 수 있습니다. 여기서 x는 사이트 전체에서 사용되는 정렬 값 중 하나입니다.

Narrows 는 전체 항목의 하위 집합을 표시하여 페이지의 내용을 필터링합니다.

Narrows 매개변수가 Narrows 매개변수가 없는 th URL의 콘텐츠 하위 집합보다 덜 유용한 콘텐츠를 표시하는 경우 "Crawl No URLs"를 지정할 수 있습니다.

예제에 표시된 URL이 중복 콘텐츠를 제공하는지 다시 확인하십시오.

지정된 매개변수는 페이지에 표시되는 내용을 결정합니다.

특정 언어를 검색 결과에서 크롤링/사용할 수 없도록 제외하려면 "모든 URL 크롤링"을 지정하십시오. 검색 엔진이 사이트 구조를 더 쉽게 이해할 수 있도록 매개변수가 아닌 하위 디렉토리 또는 하위 폴더에 언어를 배치하는 것이 가장 좋습니다.

페이지 매김 은 여러 페이지 시퀀스의 구성 요소 페이지를 표시합니다. 모든 URL 크롤링을 사용합니다.

하나의 URL에 있는 여러 매개변수는 어떻습니까? 모든 URL이 크롤링에 적합한 것으로 시작한 다음 포함이 아닌 제거 프로세스로 각 설정을 적용한다고 상상해 보십시오.
URL의 매개변수가 URL 매개변수 설정과 일치하는 경우 일치하는 설정이 URL 없음 크롤링을 지정한 경우 크롤링하지 마십시오. URL이 모든 경로를 통과하면 크롤링됩니다.

모범 사례:
내부 링크에는 표준 URL만 포함되어야 합니다.
Sitemap에 표준 나열
정식 프로모션 지원
보다 정확한 인덱스 카운트 제공
페이지 인덱싱 마크업은 여전히 ​​유용합니다. rel canonical, rel next/prev를 함께 사용할 수 있습니다.
보다 효율적인 크롤링을 위해 URL 매개변수 활용