정규식을 시작하는 방법

게시 됨: 2021-07-21

정규식은 마케팅 공간에서 종종 간과되는 기술 기술 중 하나입니다. SEO용 데이터 추출을 위해 Google Search Console, Google Analytics 및 Google Data Studio에서 사용할 수 있습니다.

이 기사는 Regex의 개념과 SEO 서비스의 일부로 데이터 분석을 활용하는 이점에 전적으로 초점을 맞추고 있습니다.

데이터 과학 및 데이터 분석은 검색 엔진 최적화의 미래에서 큰 역할을 합니다. 오늘날의 관행에서는 온페이지, 오프페이지 및 기술 SEO에만 의존할 수 없습니다.

데이터 SEO는 키워드 순위 및 유기적 트래픽에서 원하는 결과를 얻는 데 큰 역할을 합니다.

Regex는 SEO 공간의 많은 행위자에게 매우 중요한 기술인 데이터 세트에서 특정 문자 패턴을 추출하는 데 도움이 됩니다.

  • SEO 전문가
  • 웹 운영자 및 웹 분석 팀
  • 연구원/데이터 엔지니어
  • 디지털 마케팅 전문가/컨설턴트

정규식이란 무엇입니까?

일반적으로 정규식으로 알려진 Regex는 패턴 일치에 사용되는 도구 중 하나입니다. 정규식은 텍스트를 일치, 관리 및 필터링하기 위해 패턴을 나타내는 문자열 또는 일련의 문자입니다.

정규식 문자열은 다음과 같습니다.
([0-9]+(\.[0-9]*)?)
패턴을 설명하기 위해 문자, 기호 및 기타 요소 집합을 사용합니다. 패턴은 전화번호, URL, 날짜 또는 시간, 주소, 제품 참조와 같은 식별자 또는 코드 페이지 내의 텍스트 문장일 수 있습니다.

그런 다음 설명한 패턴과 일치하는 모든 텍스트 또는 목록에서 시퀀스를 찾을 수 있습니다.

[사례 연구] 로그 파일 분석으로 순위, 유기적 방문 및 매출 향상

2017년 초 TutorFair.com 팀은 Omi Sido의 SEO 서비스에 도움을 요청했습니다. 그들의 웹사이트는 순위와 유기적 방문으로 어려움을 겪고 있었습니다.
사례 연구 읽기

Regex는 SEO에서 어떻게 사용됩니까?

SEO 관행에서 이는 웹사이트에서 트래픽을 발생시키는 키워드 또는 구문을 필터링하는 데 도움이 됩니다. 결과적으로 이 필터는 사용자의 행동과 검색 의도를 분석하는 데 도움이 됩니다. 이는 Google이 NLP를 사용하여 사용자 의도를 더 잘 식별하는 데 도움이 된 Google 검색 엔진의 BERT 업데이트 이후 점점 더 중요해졌습니다.

그 후, 검색 엔진은 이제 사용자 의도를 이해하는 데 집중하고 SERP의 첫 번째 페이지에서 가장 매력적인 콘텐츠 순위를 지정합니다. Google Analytics와 Google Search Console은 모두 Regex 기술의 사용을 지원하는 SEO에서 널리 사용되는 무료 도구입니다.

기본 정규식 기술: 연산자

더 진행하기 전에 Regex를 효과적으로 사용하려면 연산자를 이해해야 합니다. 정규식 연산자는 다섯 가지 범주로 나뉩니다.

  1. 문자 집합
  2. 와일드카드
  3. 앵커
  4. 여러 떼
  5. 이스케이프 문자

각 연산자는 문자 또는 명령어의 유형을 나타냅니다. 다음은 주요 연산자입니다.

캐릭터 클래스

문자 클래스는 문자 집합 또는 유형입니다.

  • \d - 임의의 한 자리 숫자와 일치합니다.
  • \D – 숫자가 아닌 모든 문자와 일치합니다.
  • \w – 하나의 "단어 문자"(문자, 숫자, 밑줄)와 일치합니다.
  • \s – 모든 공백(공백, 탭, …)과 일치합니다.
  • \S – 공백이 아닌 모든 문자와 일치합니다.
  • ?-i – 다음 모든 문자에 대해 대소문자를 구분하여 일치하도록 지정합니다.

와일드카드

와일드카드는 일치하는 특정 문자를 지정하지 않습니다.

  • 점(.) – 단일 문자(문자, 숫자 또는 기호)와 일치합니다.
  • 물음표(?) – 이전 문자와 0번 또는 1번 일치합니다.
  • 더하기 기호(+) - 이전 문자를 1회 이상 일치시키는 데 도움이 됩니다.
  • 별표(*) – 이전 문자를 0번 이상 일치시키는 데 도움이 됩니다.
  • 파이프(|) – OR 일치를 만듭니다.

앵커

앵커는 일치시키려는 패턴의 일부를 설명합니다.

  • 캐럿(^) – 정규 표현식이 문자열의 어느 곳이 아니라 문자열이나 줄의 시작 부분에 있는 문자와 일치해야 함을 나타냅니다.
  • 달러 기호($) – 정규 표현식이 문자열의 어느 곳이 아니라 문자열이나 줄의 끝에 있는 문자와 일치해야 함을 나타냅니다.

여러 떼

그룹은 Regex에서 요소를 그룹화하는 방법입니다.

  • 괄호(()) – 괄호 안에 묶인 문자를 "캡처"합니다. 이 문자는 나머지 Regex와 일치하는 괄호 주변의 패턴으로 설명될 수 있습니다. 여러 캡처링 그룹을 사용할 수 있으며 나타나는 순서대로 식별됩니다.
  • 대괄호([]) – 문자열의 임의의 순서로 묶인 문자 집합과 일치합니다.
  • 대시(-) – 0-9 또는 AZ와 같은 문자 범위를 나타내기 위해 대괄호 안에 사용됩니다.

탈출하다

이스케이프 문자를 사용하면 일반적으로 연산자로 해석되는 경우에도 문자를 그대로 사용할 수 있습니다.

  • 백슬래시(\) – 인접 문자가 정규식 연산자가 아니라 문자 그대로 해석되어야 함을 나타냅니다.

이제 Google Analytics와 Google Search Console에서 어떻게 사용되는지에 대한 몇 가지 기본 예를 살펴보겠습니다.

Google 애널리틱스에서 표를 필터링하는 방법

Google Analytics는 다음과 같은 데이터를 사용하여 웹사이트의 사용자 여정을 분석하는 데 도움이 되는 무료 도구 중 하나입니다.

  • 청중: 인구 통계 정보
  • 획득: 사용자가 사이트에 도달한 경로
  • 행동: 사용자가 사이트에서 하는 일
  • 전환: 사용자가 사이트에서 설정한 판매 또는 마케팅 목표를 달성했는지 여부

Regex를 사용하여 Google Analytics의 데이터를 필터링하고 사용자 행동을 이해할 수 있습니다.

위 이미지에서 Regex /ebooks/|/tools/ 는 "또는"을 의미하는 |(파이프)를 사용하여 웹사이트의 1000페이지 중 2페이지를 필터링하는 데 사용됩니다. 이 문자열은 다음과 같이 읽을 수 있습니다. "/ebooks/ 또는 /tools/가 포함된 페이지만 찾기

같은 방식으로 다른 모든 문자열을 사용하여 사용자의 행동과 웹사이트에서 방문하는 페이지를 식별하는 데 마스터가 될 수 있습니다.

Google Search Console에서 쿼리를 필터링하는 방법

Google Search Console은 Google Analytics와 같은 중요한 도구 중 하나입니다. Google이 검색 결과에서 페이지를 사용하는 방법에 대한 정보를 제공하고, 기술적 SEO 측면에서 문제를 진단하고, 사용자 행동과 관련된 데이터를 얻는 데 가치를 추가합니다.

최근 Google Search Console은 데이터 필터링을 고급 수준으로 개선하기 위해 2021년 4월에 "정규식" 기능을 추가했습니다. 다음과 같은 패턴을 필터링할 수 있습니다.

  • 정규식 일치
  • 정규식과 일치하지 않음

GSC가 제공하는 많은 시설이 있으며 그 중 성과 보고서가 눈에 띕니다. 여기에서 다음과 같은 정보를 찾을 수 있습니다.

  • 총 클릭수
  • 총 노출수
  • 평균 CTR
  • 평균 위치
  • 쿼리(최대 1000개의 키워드)
  • 순위가 매겨진 페이지
  • 국가
  • 장치
  • 검색 노출
  • 날짜

보고서 맨 위에 필터링 옵션이 있습니다. Regex를 사용하려면 "+새로 만들기" 옵션을 클릭해야 합니다.

Regex를 사용하여 쿼리, 페이지, 국가, 장치 및 검색 모양을 필터링합니다.

다음은 "디지털 대행사", "디지털 대행사" 또는 디지털과 대행사(예: "디지털 커뮤니케이션 대행사" 및 "SEO 대행사의 디지털 전문 지식은 무엇인가") 사이에 다른 텍스트가 있는 구를 필터링하는 기본 예입니다. Regex digital.+agency :

결과는 다음과 같습니다.

정규식을 사용하는 이유

먼저 문자열과 연산자의 개념을 배워야 하지만 Regex는 많은 SEO 실무자에게 유용한 새 도구가 될 수 있습니다. Regex는 검색 의도, 콘텐츠 분석, 사용자 행동 등을 식별하는 데 도움이 될 수 있습니다.

SEO의 미래는 데이터와 해결해야 하는 즉각적인 효과가 있는 기술적 문제에 대한 이해에 달려 있습니다.

데이터 필터링을 사용하여 웹사이트에 대한 추가 정보를 제공하는 많은 도구가 있습니다. 여기에는 Ahrefs 및 SEMrush, Oncrawl과 같은 크롤러뿐만 아니라 Google Analytics 및 Google Search Console과 같은 도구가 포함될 수 있습니다.

Regex를 사용할 때는 연산자와 문자에 대한 이해가 필요합니다. 그러면 그로부터 이익을 얻는 방법론이 명확해질 것입니다. 정규식 필터를 사용하면 검색 의도를 파악하는 데 사용할 수 있는 데이터를 이해하고 사용자를 웹사이트로 유도하는 검색어에 집중하는 데 도움이 됩니다.

예, SEO의 목표는 트래픽과 순위 키워드를 맨 위에 올리는 것입니다. 그러나 최우선 순위는 더 많은 전환과 판매를 얻는 것입니다. Regex는 웹사이트를 변환 기계로 바꾸는 데 도움이 될 수 있습니다.