XML Sitemap: 최적화를 위한 주요 권장 사항
게시 됨: 2021-03-26사이트의 Sitemap.xml은 Google 봇이 색인을 생성할 페이지에 대한 좋은 탐색 역할을 할 수 있습니다. 내부 연결이 좋지 않더라도 기본 페이지를 더 빨리 찾을 수 있도록 도와줍니다.
이 기사에서는 XML Sitemap 최적화를 위한 다양한 권장 사항과 이를 수행하는 것이 좋은 이유를 제시합니다.
기능 및 장점
봇이 더 쉽게 작동하도록 하고 쉽게 찾을 수 없는 사이트의 페이지와 링크에 대한 "보고서"를 받을 수 있도록 합니다.
SEO의 이점 중 일부는 다음과 같습니다.
- 더 빠른 인덱싱 – 검색 엔진이 새 페이지를 훨씬 빨리 찾을 수 있으므로 검색 결과에 웹사이트를 인덱싱하고 표시하는 프로세스가 더 빨라집니다. 여기서 특이한 점은 인덱스 해제에도 도움이 될 수 있다는 것입니다(자세한 정보는 여기).
- 내부 페이지의 더 나은 인덱싱 – 검색 엔진은 웹사이트를 크롤링할 때 찾지 못한 페이지를 찾을 수 있습니다. 그러나 이것이 반드시 모든 항목이 색인화된다는 것을 의미하지는 않습니다.
- 인덱싱된 페이지 모니터링. Google Search Console과 함께 Google에서 색인을 생성하는 XML Sitemap에 포함된 URL을 찾을 수 있습니다.
XML Sitemap이 중요합니까?
다음과 같은 사이트에서는 중요합니다.
- 구조가 좋지 않거나 내부 링크가 잘 배포되지 않습니다.
- 많은 페이지가 있음 - XML 사이트맵은 검색 엔진이 새롭거나 업데이트된 페이지를 찾는 데 도움이 됩니다.
- 인바운드 링크가 많지 않습니다. 이것은 귀하의 페이지를 찾는 좋은 방법이 될 것입니다.
요구 사항 및 형식
Google은 여러 Sitemap 형식을 지원합니다. 모든 형식과 표준은 https://www.sitemaps.org/index.html 주소에서 찾을 수 있습니다.
모든 형식은 사이트맵을 50MB(압축되지 않음) 및 50,000개 주소로 제한합니다. 더 큰 파일이나 더 많은 주소가 있는 경우 모든 맵이 포함된 색인 파일을 만들어야 합니다(아래 문서에서 설명).
주요 권장 사항은 다음과 같습니다.
- 파일은 UTF-8로 인코딩되어야 합니다.
- 열린 태그로 시작하고 ...와 같은 닫기 태그로 끝나야 합니다. ;
- 태그에 표준 프로토콜을 지정합니다.
- 각 URL 항목에 대한 기본 태그 ;
- 저장을 위해 기본 태그에 참여해야 하는 프로토콜(https 또는 http)로 시작하는 URL을 태그에 지정합니다.
XML 사이트맵에 대한 추가 선택적 속성
Google은 사이트에서 속성을 사용하지 않습니다. 다른 모든 속성을 사용할 수 있지만 반영 여부에 따라 다릅니다. 따라서 Google은 이러한 태그를 매우 중요하게 생각하지 않습니다. 그들은:
- – 마지막 파일 변경 날짜를 나타냅니다. W3C 날짜/시간 형식이어야 합니다.
- – 페이지가 업데이트될 가능성이 있는 빈도. 이 값은 검색 엔진에 대한 일반 정보를 제공합니다. 유효한 값은 항상, 매시간, 매일, 매주, 매월, 매년, 사용 안함입니다.
이 태그의 값은 명령이라기보다 힌트로 간주된다는 점에 유의해야 합니다. 로봇은 이 정보를 보고 고려하지만, 궁극적으로 다른 많은 요인에 따라 사용 여부를 스스로 결정합니다.
- – 사이트의 다른 URL보다 URL의 우선 순위를 지정합니다. 유효한 값의 범위는 0.0입니다. 1.0으로.
여기서 다시 말하지만, 이 우선순위는 상대적이며 로봇의 필수 조건이 아니거나 적어도 아직 그렇게 받아들여지지 않는다는 점을 명심해야 합니다. 그러나 시도해 보기로 결정했다면 다음 가이드를 사용하십시오.
- 0 – 0.3: 오래된 뉴스, 더 이상 유효하지 않지만 역사적으로 유용한 정보
- 4 – 0.7: 블로그 기사, 페이지 카테고리, 자주 묻는 질문;
- 8 – 1.0: 홈페이지, 제품 페이지, 최적화된 콘텐츠가 있는 모든 페이지.
다음 예는 하나의 URL만 포함하고 기울임꼴 로 작성된 모든 선택적 태그를 사용하는 Sitemap을 보여줍니다.
https://netpeak.bg
2018-09-15
월간 간행물
0.8
중요한 페이지 식별
고품질 페이지와 최적화된 페이지를 추가하세요. 전반적인 품질은 더 나은 순위를 위해 매우 중요합니다. 이것은 경쟁보다 귀하에게 심각한 우선 순위를 줄 수있는 Google의 심각한 요소입니다.
우리는 저품질 페이지를 방문하고 싶지 않으며 Google 봇도 방문하지 않습니다. 사용자에게 유용하지 않고 최적화가 잘 되지 않은 수천 개의 페이지로 안내하는 경우 이는 귀하에게만 피해를 줄 수 있습니다. 고품질 페이지란 무엇입니까? 간단히 말해서 다음과 같은 페이지입니다.
- 고유한 콘텐츠가 충분해야 합니다.
- 행동(댓글, 리뷰 등)을 유도하여 사용자의 참여를 빠르게 유도합니다.
- 이미지, 비디오 등을 포함합니다.
- Google 정책을 위반하지 마십시오.
색인 생성을 위해 열린 페이지
크롤링 예산은 일반적으로 시간 단위(일, 주, 월 등)당 크롤링된 페이지 수를 나타냅니다. 따라서 불필요하게 낭비하는 것은 바람직하지 않습니다.
"Noindex" 메타 태그가 포함된 페이지는 사이트맵에 추가하면 안 됩니다. 논리적인 순서를 따르기 위해서는 모든 것이 중요합니다.
인덱싱을 위해 폐쇄된 주소를 포함하지 않고 자동 검사를 수행해야 합니다.
다음 지침을 따르는 것이 좋습니다.
- https://example.com/category/product 페이지에 "noindex" 메타 태그가 있는 경우 사이트의 XML 맵에 포함되어서는 안 됩니다.
- robots.txt를 통한 색인 생성을 위해 페이지를 닫으면 XML 맵에 포함되어서는 안 됩니다.
허용하지 않음: /category/product
NOINDEX: /카테고리/제품
- 페이지가 HTTP 헤더의 X-Robots-Tag를 통한 인덱싱을 위해 닫힌 경우 사이트의 XML 맵에도 포함되어서는 안 됩니다.
HTTP/1.1 200 확인
날짜: 2010년 5월 25일 화요일 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)
페이지의 표준 버전
유사한 콘텐츠가 있는 여러 URL을 통해 단일 페이지에 액세스하는 것은 Google에서 중복으로 간주됩니다.
"기본" 페이지이고 크롤링 및 인덱싱해야 하는 봇에 지시하려면 "link rel canonical" 속성을 사용해야 합니다.
예를 들어 https://example.com/category/product-1 페이지에 https://example.com/product에 대한 표준이 있는 경우 http://example.com/category/product-1은 XML 사이트맵
프로세스 자동화는 확실히 골치 아픈 문제를 줄이고 수동 검사 시간을 절약할 수 있으므로 자동화된 검사를 수행해야 합니다.
200 OK를 반환하는 페이지
200 OK 응답을 반환하는 주소를 포함합니다. 자동 확인을 수행하고 200 OK 이외의 응답을 반환하는 주소(예: 404, 301 등)는 포함하지 않는 것이 중요합니다.
예를 들어 https://example.com/product 페이지가 200 OK와 다른 응답을 반환하면 사이트맵에 참여하지 않아야 합니다.
확인을 위해 다음 도구를 사용할 수 있습니다. https://soft.galinov.com/을 확인하십시오.
페이지 매김의 페이지
sitemap.xml에 모든 페이지를 절대적으로 포함할 필요는 없습니다. 봇은 적절하게 설명된 경우 관련 카테고리의 첫 번째 페이지에서 탐색할 수 있을 만큼 충분히 똑똑합니다. 다음을 수행하는 것이 좋습니다.
- 카테고리의 주요 페이지만 포함합니다.
- 로봇이 페이지 사이의 연결을 볼 수 있도록 페이지를 rel = next / rel = prev로 표시합니다.
- 페이지 매김의 각 페이지에는 기본 페이지가 아니라 자체에 대한 표준 가이드가 있어야 합니다. 반대의 경우 봇에게 "5,000개의 제품과 20개의 페이지가 있다는 것은 중요하지 않습니다. 처음과 같다."
예를 들어 https://example.com/category/page-2 페이지는 지도에 참여해서는 안 됩니다. 여기에서 Google의 공식 의견과 권장 사항을 찾을 수 있습니다.
파일 크기 최소화
Google과 Bing은 2016년에 파일 크기를 10MB에서 50MB로 늘렸지만 여전히 Sitemap을 가능한 한 작게 유지하는 것이 좋습니다.
물론 걱정할 사항은 아니지만 사이트맵에 50,000개 이상의 URL이 포함되어 있거나 크기가 50MB를 초과하는 경우 더 많은 XML 맵으로 분할해야 합니다. 이 경우 모든 XML 맵에 대한 참조는 별도의 사이트맵 색인 파일에 설명되어야 합니다.
XML Sitemap 색인 파일이란?
여러 Sitemap 파일을 제출할 수 있지만 각 파일은 위의 규칙을 준수해야 합니다. 원하는 경우 gzip을 사용하여 파일을 압축하여 요구 사항에 따라 크기를 줄일 수 있습니다.
인덱스 파일의 XML 형식은 일반 사이트맵 형식과 매우 유사합니다. 다음을 포함해야 합니다.
- 태그 열기 및 닫기 ;
- 기본 XML 속성이 다음과 같은 각 Sitemap에 대한 항목입니다.
- 태그를 기본 속성에 추가합니다.
권장 속성도 포함됩니다.
참고: Sitemap 색인 파일은 동일한 사이트에 있는 지도만 나열할 수 있습니다. 예를 들어:
https://example.com/sitemap_index.xml은 https://example.com의 지도를 포함할 수 있지만 https://www.saitprimer.com 또는 https://www.example.com은 포함하지 않을 수 있습니다.
다른 모든 파일과 마찬가지로 인덱스 파일도 UTF-8로 인코딩해야 합니다.
다음 예는 두 개의 지도를 나열하는 Sitemap 색인을 보여줍니다.
http://www.example.com/sitemap1.xml.gz
2018-10-01T18:23:17+00:00
http://www.example.com/sitemap2.xml.gz
2017-01-01
모바일 버전에 대한 설명
Google 봇이 콘텐츠를 찾고 데스크톱과 모바일 페이지 간의 연결을 이해하도록 도와야 합니다. XML 사이트맵에서 다음과 같이 데스크톱 버전 페이지에 대해 rel = "alternate" 속성을 추가해야 합니다.
xmlns:xhtml="http://www.w3.org/1999/xhtml">
http://www.example.com/page-1/
<xhtml:링크
rel="대체"
media="화면 전용 및 (최대 너비: 640px)"
href="http://m.example.com/page-1″ />
각 데스크톱 페이지는 모바일 버전의 한 페이지에 해당해야 합니다. 예를 들어, 여러 데스크톱 페이지가 rel = "alternate"를 통해 모바일 버전의 한 페이지에 또는 그 반대로 링크되는 것은 권장되지 않습니다.
리디렉션도 확인해야 합니다. 데스크톱 페이지가 모바일 버전의 동일한 콘텐츠에 해당하고 다른 페이지로 리디렉션되지 않는 것이 중요합니다. 추가 정보는 여기에 있습니다.
봇이 XML Sitemap을 찾는 방법
프로세스의 모든 자동화를 완료하고 서버에 업로드(또는 플러그인으로 생성)하면 봇이 찾을 수 있는 위치에 단서를 남겨야 합니다.
가장 좋은 방법은 robots.txt 파일에 링크를 포함하는 것입니다. 이것은 Sitemap Discovery라고도 하며 Google, Bing 및 Yahoo가 2007년에 로봇이 XML Sitemap을 찾을 수 있도록 도입한 것입니다.
지도 또는 색인 파일의 전체 경로를 포함하기만 하면 됩니다.
주소의 올바른 음역
공식 Google 문서(Sitemap 작성 및 제출)에서는 모든 데이터 값(URL 포함)에 ASCII 문자만 포함해야 한다고 강조합니다. 제어 코드나 * 또는 {}와 같은 특수 문자를 포함할 수 없습니다.
사이트 URL에 이러한 문자가 포함된 경우 추가하려고 하면 오류가 발생합니다.
Google에 지도 제출
Google Search Console을 통해 사이트맵을 Google에 제출할 수 있습니다.
제출하기 전에 오류가 있는지 확인하십시오. 주요 방문 페이지의 색인을 생성하는 데 방해가 될 수 있는 오류를 모두 지우는 것이 중요합니다.
이상적으로는 인덱싱된 페이지 수는 제출된 페이지 수와 같아야 합니다.
결론
- 일관성을 유지하십시오. 페이지가 robots.txt 또는 "noindex"에 의해 차단된 경우 XML 맵에 없는 것이 좋습니다.
- 프로세스 자동화 - 위의 모든 권장 사항은 자동화에 사용할 수 있어야 합니다. 이렇게 하면 시간이 절약되고 크롤링 예산이 최적화된 상태를 유지하는 데 도움이 되며 많은 골칫거리를 줄일 수 있습니다.
- 매우 큰 사이트가 있는 경우 서버 시간을 절약하고 사이트의 모든 중요한 페이지를 다룰 다양한 맵이 포함된 색인 파일을 사용하십시오.