SEO가 Excel을 버리고 SQL을 배워야 하는 이유
게시 됨: 2019-10-10대부분의 SEO 업계에서는 Excel을 사용하여 데이터를 분석하는데, 이는 우리가 사용할 수 있는 최고의 도구가 아닙니다.
SEO로서 우리가 노출되는 데이터의 양은 매년 빠르게 증가하고 있습니다. 그러나 Excel은 빅 데이터에 적합하지 않으며 통합 문서당 행이 100만 개 이상으로 제한됩니다.
또한 스프레드시트에서 데이터를 처리하는 방식으로 인해 SEO 분석이 느리고 번거로워집니다. 분석은 데이터 자체에 영향을 미치며 수행, 반복 및 공유가 어렵습니다.
이것이 내가 모든 SEO, 특히 사내에서 SQL(및 Python)을 선택하도록 권장하는 이유입니다.
엑셀의 한계는?
스프레드시트를 사용해 본 적이 있다면 다음을 알고 있습니다.
- 실수로 데이터를 손상시키는 항목을 변경하기 쉽습니다.
- 새로운 데이터에 대한 오래된 분석을 복제하는 것은 어렵습니다.
- 데이터 세트에 수십만 개가 넘는 행이 포함되어 있으면 속도가 느립니다.
- 거대한 스프레드시트를 다른 사람들과 공유하는 것은 번거롭습니다.
Excel에서 SQL로 전환하는 이유는 무엇입니까?
Excel에서 SQL로 전환하면 위에서 언급한 모든 문제가 사라집니다. 다음과 같은 몇 가지 추가 혜택이 있습니다.
- SQL은 Excel보다 빠릅니다. Excel에서 몇 시간이 걸리는 작업을 SQL에서는 몇 분 안에 완료할 수 있습니다.
- SQL은 분석을 데이터와 분리합니다. SQL을 사용하면 분석한 데이터가 별도로 저장됩니다. 이는 동료에게 작은 코드 파일을 보내 분석에 액세스할 수 있음을 의미합니다. 데이터를 손상시키지 않고 분석을 다시 실행할 수 있습니다. 그리고 모든 코드를 재사용할 수 있습니다.
SQL이란 무엇입니까?
SQL은 데이터베이스에 저장된 데이터를 추출하고 분석하는 데 사용되는 표준 언어입니다.
다음은 SQL 구문의 예입니다.
언어를 몰라도 이 SQL 구문을 이해할 수 있습니다.
- 모든 열 선택
- 테이블에서(데이터 소스)
- 열이 '일부 값'과 동일한 경우
Excel에서 필터를 추가하는 것과 같습니다.
SEO가 SQL을 배워야 하는 이유
SQL은 더 많은 데이터를 처리할 수 있는 가능성을 열어줍니다. SEO, 특히 기술적인 SEO는 방대한 데이터 세트와 대규모 데이터 세트를 결합할 때 가치가 증가하는 것을 찾습니다. 예를 들어 로그 파일, 크롤링 데이터 및 기타 기술 데이터 세트에 대해 생각하면 모두 Excel의 한계를 초과합니다.
그리고 이 데이터를 처리하려면 대규모 데이터 분석을 위해 구축된 도구를 사용해야 합니다. 대규모 데이터 분석은 SQL이 탁월한 영역 중 하나입니다.
Excel과 마찬가지로 SQL은 데이터를 더 쉽게 사용할 수 있도록 하는 집계 함수 또는 조건을 사용하여 새 열을 만들기 위해 데이터 집합을 랭글링할 수 있습니다. 그러나 프로그래밍에 더 가까운 논리를 사용하므로 기술 능력 향상에 관심이 있는 SEO에 대한 기술적 측면에 대한 좋은 소개이기도 합니다.
기술 SEO를 위한 SQL의 실제 적용
이제 SEO 데이터 분석에서 SQL이 Excel보다 성능이 더 좋은 몇 가지 예를 공유하겠습니다.
시작하기 전에 SQL을 활용하여 데이터를 분석하려면 데이터베이스에 데이터를 저장해야 한다는 점을 기억하십시오. 이것은 그것을 달성하는 방법에 대한 가이드는 아니지만 다음은 몇 가지 지침입니다.
- 데이터 팀에 연락하여 데이터 웨어하우스에 이미 있는 것을 확인하십시오.
- 또는 Moz에서 "대규모 검색 엔진 최적화를 위한 빅 쿼리 사용 방법" 가이드를 따라 직접 해보세요.
로그 파일 분석
로그 파일은 빅 데이터의 경우입니다. 로그 파일은 쉽게 백만 행을 초과하므로 샘플링 없이 Excel에서 데이터를 분석할 수 없습니다. 그리고 샘플링은 편향이나 오류를 유발할 수 있습니다.
그러나 데이터베이스(예: Big Query)에 데이터가 있는 경우 SQL로 분석할 수 있습니다.
다음은 SQL로 쉽게 답할 수 있는 몇 가지 일반적인 질문입니다.
- Googlebot이 내 웹사이트를 얼마나 자주 방문합니까?
- 내 사이트를 크롤링하는 Googlebot 사용자 에이전트는 무엇입니까?
- 요청 적중의 몇 %가 200이 아닌 응답을 반환합니까?
- 각 디렉토리 또는 사이트 섹션에 대한 요청 비율은 얼마입니까?
내 블로그에서 로그 파일 분석에 대해 자세히 다루었고 데이터베이스에 설정하려면 빅 쿼리의 로그 파일 분석에 대한 Distilled의 이 가이드를 확인하세요.
크롤링 데이터 분석
대규모 웹 사이트를 크롤링하는 경우 통합 문서당 Excel의 100만 행 제한을 쉽게 초과할 수도 있습니다.
이론적으로 URL이 몇 천 개 밖에 없는 웹사이트도 잘못된 구현, 매개변수 사용, 마이그레이션의 레거시 데이터 및 기타 여러 이유로 인해 수백만 개에 이를 수 있습니다.
SQL을 사용하면 데이터를 샘플링하지 않고도 OnCrawl과 같은 크롤링 소프트웨어에서 전체 데이터 세트를 분석할 수 있습니다. 즉, Excel에서 어떻게 분석할지 걱정할 필요 없이 제품을 최대한 활용할 수 있습니다.
[사례 연구] 여러 현장 감사 처리
구글 애널리틱스 분석
한 달에 5자리 이상의 방문이 발생하는 사이트에서 작업한 적이 있다면 Google Analytics가 매우 느리다는 것을 알았을 것입니다.
SQL을 사용하여 데이터를 분석하면 작업 속도를 높일 수 있으므로 데이터가 로드될 때까지 오랜 시간을 기다리면서 사용자 인터페이스를 천천히 탐색할 필요가 없습니다.
다른 데이터 소스와 마찬가지로 SQL을 사용하면 샘플링 없이 Google Analytics 데이터를 분석할 수 있으며 프리미엄으로 업그레이드할 때 $250,000를 절약할 수 있습니다.
검색 콘솔 분석
Google Search Console 인터페이스의 데이터는 훌륭하지만 데이터를 필터링/맞춤화할 수 있는 옵션이 많지 않습니다. 또한 데이터의 처음 1000줄로 제한됩니다.
데이터를 Excel로 내보내는 것이 가장 좋지만 더 나아가 SQL로 분석하는 것은 어떻습니까!
SEO가 SQL을 배우기 위한 강의 계획서
SEO 데이터 분석을 위한 SQL은 복잡하지 않습니다. 엑셀보다 훨씬 수월합니다.
SEO 목적을 위해 다음 기능을 사용하는 방법을 배우는 데 집중해야 합니다.
- 선택 및 시작
- 코멘트
- 한계
- 어디
- 비교 연산자
- 논리 연산자
- 주문
- 그룹화 기준
- 집계 함수
- 사례
- 가입하다
먼저 Udacity에서 SQL for Data Analysis 과정을 수강하는 것이 좋습니다.
그런 다음 모드 분석 SQL 자습서로 이동합니다. Udacity 과정의 지식을 공용 데이터 웨어하우스의 데이터 세트에 적용할 수 있습니다.
마지막으로 Codecademy 또는 Datacamp의 과정을 수강하여 계속 연습할 수 있습니다.
이러한 각 플랫폼에는 사용하고 포트폴리오에 추가할 수 있는 실용적인 문제가 있습니다.
유용한 리소스:
- W3 학교
- SQL 스타일 가이드
- 에두바
결론
SEO로서 앞서가고 싶다면 SQL 및 Python과 같은 도구를 사용하여 데이터 기술을 연마할 때입니다.
SQL은 훌륭한 진입점이며 선택하기 쉽고 코딩에 대한 좋은 소개를 제공합니다. SQL을 잠그면 Python을 배울 수 있습니다.