정규식을 시작하는 방법
게시 됨: 2021-07-21정규식은 마케팅 공간에서 종종 간과되는 기술 기술 중 하나입니다. SEO용 데이터 추출을 위해 Google Search Console, Google Analytics 및 Google Data Studio에서 사용할 수 있습니다.
이 기사는 Regex의 개념과 SEO 서비스의 일부로 데이터 분석을 활용하는 이점에 전적으로 초점을 맞추고 있습니다.
데이터 과학 및 데이터 분석은 검색 엔진 최적화의 미래에서 큰 역할을 합니다. 오늘날의 관행에서는 온페이지, 오프페이지 및 기술 SEO에만 의존할 수 없습니다.
데이터 SEO는 키워드 순위 및 유기적 트래픽에서 원하는 결과를 얻는 데 큰 역할을 합니다.
Regex는 SEO 공간의 많은 행위자에게 매우 중요한 기술인 데이터 세트에서 특정 문자 패턴을 추출하는 데 도움이 됩니다.
- SEO 전문가
- 웹 운영자 및 웹 분석 팀
- 연구원/데이터 엔지니어
- 디지털 마케팅 전문가/컨설턴트
정규식이란 무엇입니까?
일반적으로 정규식으로 알려진 Regex는 패턴 일치에 사용되는 도구 중 하나입니다. 정규식은 텍스트를 일치, 관리 및 필터링하기 위해 패턴을 나타내는 문자열 또는 일련의 문자입니다.
정규식 문자열은 다음과 같습니다.
([0-9]+(\.[0-9]*)?)
패턴을 설명하기 위해 문자, 기호 및 기타 요소 집합을 사용합니다. 패턴은 전화번호, URL, 날짜 또는 시간, 주소, 제품 참조와 같은 식별자 또는 코드 페이지 내의 텍스트 문장일 수 있습니다.
그런 다음 설명한 패턴과 일치하는 모든 텍스트 또는 목록에서 시퀀스를 찾을 수 있습니다.
[사례 연구] 로그 파일 분석으로 순위, 유기적 방문 및 매출 향상
Regex는 SEO에서 어떻게 사용됩니까?
SEO 관행에서 이는 웹사이트에서 트래픽을 발생시키는 키워드 또는 구문을 필터링하는 데 도움이 됩니다. 결과적으로 이 필터는 사용자의 행동과 검색 의도를 분석하는 데 도움이 됩니다. 이는 Google이 NLP를 사용하여 사용자 의도를 더 잘 식별하는 데 도움이 된 Google 검색 엔진의 BERT 업데이트 이후 점점 더 중요해졌습니다.
그 후, 검색 엔진은 이제 사용자 의도를 이해하는 데 집중하고 SERP의 첫 번째 페이지에서 가장 매력적인 콘텐츠 순위를 지정합니다. Google Analytics와 Google Search Console은 모두 Regex 기술의 사용을 지원하는 SEO에서 널리 사용되는 무료 도구입니다.
기본 정규식 기술: 연산자
더 진행하기 전에 Regex를 효과적으로 사용하려면 연산자를 이해해야 합니다. 정규식 연산자는 다섯 가지 범주로 나뉩니다.
- 문자 집합
- 와일드카드
- 앵커
- 여러 떼
- 이스케이프 문자
각 연산자는 문자 또는 명령어의 유형을 나타냅니다. 다음은 주요 연산자입니다.
캐릭터 클래스
문자 클래스는 문자 집합 또는 유형입니다.
- \d - 임의의 한 자리 숫자와 일치합니다.
- \D – 숫자가 아닌 모든 문자와 일치합니다.
- \w – 하나의 "단어 문자"(문자, 숫자, 밑줄)와 일치합니다.
- \s – 모든 공백(공백, 탭, …)과 일치합니다.
- \S – 공백이 아닌 모든 문자와 일치합니다.
- ?-i – 다음 모든 문자에 대해 대소문자를 구분하여 일치하도록 지정합니다.
와일드카드
와일드카드는 일치하는 특정 문자를 지정하지 않습니다.
- 점(.) – 단일 문자(문자, 숫자 또는 기호)와 일치합니다.
- 물음표(?) – 이전 문자와 0번 또는 1번 일치합니다.
- 더하기 기호(+) - 이전 문자를 1회 이상 일치시키는 데 도움이 됩니다.
- 별표(*) – 이전 문자를 0번 이상 일치시키는 데 도움이 됩니다.
- 파이프(|) – OR 일치를 만듭니다.
앵커
앵커는 일치시키려는 패턴의 일부를 설명합니다.
- 캐럿(^) – 정규 표현식이 문자열의 어느 곳이 아니라 문자열이나 줄의 시작 부분에 있는 문자와 일치해야 함을 나타냅니다.
- 달러 기호($) – 정규 표현식이 문자열의 어느 곳이 아니라 문자열이나 줄의 끝에 있는 문자와 일치해야 함을 나타냅니다.
여러 떼
그룹은 Regex에서 요소를 그룹화하는 방법입니다.
- 괄호(()) – 괄호 안에 묶인 문자를 "캡처"합니다. 이 문자는 나머지 Regex와 일치하는 괄호 주변의 패턴으로 설명될 수 있습니다. 여러 캡처링 그룹을 사용할 수 있으며 나타나는 순서대로 식별됩니다.
- 대괄호([]) – 문자열의 임의의 순서로 묶인 문자 집합과 일치합니다.
- 대시(-) – 0-9 또는 AZ와 같은 문자 범위를 나타내기 위해 대괄호 안에 사용됩니다.
탈출하다
이스케이프 문자를 사용하면 일반적으로 연산자로 해석되는 경우에도 문자를 그대로 사용할 수 있습니다.
- 백슬래시(\) – 인접 문자가 정규식 연산자가 아니라 문자 그대로 해석되어야 함을 나타냅니다.
이제 Google Analytics와 Google Search Console에서 어떻게 사용되는지에 대한 몇 가지 기본 예를 살펴보겠습니다.
Google 애널리틱스에서 표를 필터링하는 방법
Google Analytics는 다음과 같은 데이터를 사용하여 웹사이트의 사용자 여정을 분석하는 데 도움이 되는 무료 도구 중 하나입니다.
- 청중: 인구 통계 정보
- 획득: 사용자가 사이트에 도달한 경로
- 행동: 사용자가 사이트에서 하는 일
- 전환: 사용자가 사이트에서 설정한 판매 또는 마케팅 목표를 달성했는지 여부
Regex를 사용하여 Google Analytics의 데이터를 필터링하고 사용자 행동을 이해할 수 있습니다.
위 이미지에서 Regex /ebooks/|/tools/
는 "또는"을 의미하는 |(파이프)를 사용하여 웹사이트의 1000페이지 중 2페이지를 필터링하는 데 사용됩니다. 이 문자열은 다음과 같이 읽을 수 있습니다. "/ebooks/ 또는 /tools/가 포함된 페이지만 찾기
같은 방식으로 다른 모든 문자열을 사용하여 사용자의 행동과 웹사이트에서 방문하는 페이지를 식별하는 데 마스터가 될 수 있습니다.
Google Search Console에서 쿼리를 필터링하는 방법
Google Search Console은 Google Analytics와 같은 중요한 도구 중 하나입니다. Google이 검색 결과에서 페이지를 사용하는 방법에 대한 정보를 제공하고, 기술적 SEO 측면에서 문제를 진단하고, 사용자 행동과 관련된 데이터를 얻는 데 가치를 추가합니다.
최근 Google Search Console은 데이터 필터링을 고급 수준으로 개선하기 위해 2021년 4월에 "정규식" 기능을 추가했습니다. 다음과 같은 패턴을 필터링할 수 있습니다.
- 정규식 일치
- 정규식과 일치하지 않음
GSC가 제공하는 많은 시설이 있으며 그 중 성과 보고서가 눈에 띕니다. 여기에서 다음과 같은 정보를 찾을 수 있습니다.
- 총 클릭수
- 총 노출수
- 평균 CTR
- 평균 위치
- 쿼리(최대 1000개의 키워드)
- 순위가 매겨진 페이지
- 국가
- 장치
- 검색 노출
- 날짜
보고서 맨 위에 필터링 옵션이 있습니다. Regex를 사용하려면 "+새로 만들기" 옵션을 클릭해야 합니다.
Regex를 사용하여 쿼리, 페이지, 국가, 장치 및 검색 모양을 필터링합니다.
다음은 "디지털 대행사", "디지털 대행사" 또는 디지털과 대행사(예: "디지털 커뮤니케이션 대행사" 및 "SEO 대행사의 디지털 전문 지식은 무엇인가") 사이에 다른 텍스트가 있는 구를 필터링하는 기본 예입니다. Regex digital.+agency
:
결과는 다음과 같습니다.
정규식을 사용하는 이유
먼저 문자열과 연산자의 개념을 배워야 하지만 Regex는 많은 SEO 실무자에게 유용한 새 도구가 될 수 있습니다. Regex는 검색 의도, 콘텐츠 분석, 사용자 행동 등을 식별하는 데 도움이 될 수 있습니다.
SEO의 미래는 데이터와 해결해야 하는 즉각적인 효과가 있는 기술적 문제에 대한 이해에 달려 있습니다.
데이터 필터링을 사용하여 웹사이트에 대한 추가 정보를 제공하는 많은 도구가 있습니다. 여기에는 Ahrefs 및 SEMrush, Oncrawl과 같은 크롤러뿐만 아니라 Google Analytics 및 Google Search Console과 같은 도구가 포함될 수 있습니다.
Regex를 사용할 때는 연산자와 문자에 대한 이해가 필요합니다. 그러면 그로부터 이익을 얻는 방법론이 명확해질 것입니다. 정규식 필터를 사용하면 검색 의도를 파악하는 데 사용할 수 있는 데이터를 이해하고 사용자를 웹사이트로 유도하는 검색어에 집중하는 데 도움이 됩니다.
예, SEO의 목표는 트래픽과 순위 키워드를 맨 위에 올리는 것입니다. 그러나 최우선 순위는 더 많은 전환과 판매를 얻는 것입니다. Regex는 웹사이트를 변환 기계로 바꾸는 데 도움이 될 수 있습니다.