SEO를 위한 RegEx: 정규 표현식의 12가지 용도
게시 됨: 2024-06-07웹사이트 개발자와 콘텐츠 마케팅 담당자는 데이터가 금이라는 것을 알고 있습니다. 이는 디지털 전략을 개편하거나 개선하는 데 사용하는 깊은 통찰력의 기초를 제공할 수 있습니다.
하지만 데이터를 최대한 활용하려면 어떻게 해야 할까요?
아마도 Google Search Console이 있고 그 주요 쿼리 기능인 '같음'과 '포함'을 알고 있을 것입니다. 이는 전략적 통찰력을 갖춘 의미 있는 보고서를 생성하는 데 사용할 수 있는 방식으로 데이터 정보를 집계하는 방법을 제공할 수 있습니다.
"같음" 및 "포함"과 같은 기본 제공 커넥터보다 더 강력한 검색을 수행할 수 있다면 어떨까요? 이것이 바로 구현하고 사용하기 쉬운 코딩 도구인 RegEx의 약속입니다.
여기에서는 RegEx에 대한 기본 사항, RegEx의 차이점, RegEx를 사용하여 SEO 게임을 향상시키는 방법에 대해 설명합니다.
RegEx란 무엇이며 어떻게 생겼나요?
RegEx는 오랫동안 개발자들 사이에 공개된 비밀이었습니다. 데이터를 검색하고 구성하는 방법에 있어 엄청난 유연성을 제공하므로 내장된 Google Search Console 도구만으로는 사용할 수 없는 심층적인 통찰력으로 보고서를 맞춤설정할 수 있습니다.
RegEx는 정규 표현식을 의미합니다. 검색 기능을 수행하는 코딩 도구입니다. 최근에 텍스트 문서를 사용한 거의 모든 사람들이 사용했던 "찾기 및 바꾸기"는 실제로 RegEx입니다.
실제로 RegEx는 Microsoft Word, 메모장 및 Google 검색 엔진과 같이 사람들이 매일 사용하는 도구를 포함하여 어디에나 있습니다. 따라서 코드이고 많은 프로그래밍 언어에 원활하게 통합되더라도 그 잠재력과 기능을 쉽게 이해할 수 있습니다.
SEO 전략 개발 시 이점은 매우 큽니다. 특히 검색 패턴을 식별하고 Google Search Console의 표면 아래에 숨어 있는 데이터에 액세스할 수 있도록 도와줍니다.
SEO의 RegEx에 대해 논의하기 전에 잠시 RegEx 문자열과 그 모양을 정의해 보겠습니다. 간단한 예는 다음과 같은 일련의 문자입니다.
- /t[aeiou]+/g
이 RegEx는 문자 "t" 뒤에 모음이 오는 모든 인스턴스를 찾습니다. 이 패턴을 다음 문장에 적용한다고 가정해 보겠습니다.
- 나는 Greg의 테이블에 앉아 토스트를 먹었습니다.
RegEx는 다음 결과를 선택합니다.
- 나는 Greg의 테이블 에 앉아 있는 동안 건배를 좀 했습니다 .
이는 RegEx를 적용한 비교적 간단한 예입니다. 더 길고 복잡한 문자 순서를 가질 수 있습니다. 또한 특정 기호는 예제에서 "t" 뒤에 올 수 있는 문자 범위를 식별하는 대괄호와 같이 RegEx가 작동하는 방식에 대한 "지침"을 제공합니다. 물음표와 별표를 포함한 문장 부호도 RegEx 문자열의 기본입니다.
이 블로그 게시물에서는 RegEx를 사용하여 SEO 보고 및 기술 SEO 감사를 최적화하기 전에 알아야 하는 RegEx 필터의 한 가지 속성에 중점을 둘 것입니다. 이것이 정규식 일치에서 "탐욕스러운"과 "게으른"의 차이점입니다. RegEx에서는 "탐욕스러운" RegEx 패턴 또는 "게으른" RegEx 패턴을 선택하는 데 도움이 되는 수량자 코드를 적용할 수 있습니다.
탐욕스러운 RegEx 패턴
RegEx 검색 문자열에 대한 가능한 일치 항목은 RegEx 필터의 정확한 매개변수에 따라 다르다는 것을 쉽게 알 수 있습니다. 이 예에서 표현식은 패턴에 맞게 가능한 가장 긴 검색 문자열을 선택했습니다. "t" 뒤에 모음이 오면 정규식 패턴은 "ate"의 "te"와 "toast"의 "toa"를 모두 선택하는 결과로 이어집니다.
이 RegEx 패턴은 가능한 가장 긴 문자열을 찾기 때문에 "탐욕"이라고 합니다. 사실 "toast"의 결과는 "toa"가 아니라 더 정확하게는 "to"와 "toa"가 될 것입니다. RegEx 패턴 일치를 완전히 이해할 수 있도록 이러한 종류의 결과를 얻을 수 있다는 사실을 아는 것이 중요합니다.
게으른 패턴
게으른 패턴에서 RegEx는 문자열과 가능한 가장 짧은 일치 항목을 찾습니다. 이 예에서 게으른 RegEx 패턴은 더 이상 "toast"의 "toa"를 별도의 결과로 선택하지 않습니다. RegEx 쿼리와 일치하는 가장 짧은 문자열인 "to"로 중지됩니다.
문자 "y", 임의 개수의 문자, "l"을 찾는 RegEx 검색의 예를 사용해 보겠습니다.
- 그리디 패턴에서 RegEx는 해당 단어가 포함된 데이터 세트에서 "yell"과 "yellow"를 선택합니다.
- 게으른 패턴에서 RegEx는 동일한 데이터 세트에서 "yel"만 선택합니다.
정규식을 사용하면 어떤 이점이 있나요?
RegEx는 검색 데이터에 대한 보고서를 생성하는 강력한 도구입니다. 디지털 활동을 깊이 조사함으로써 콘텐츠 최적화, 키워드 조사 수행 등에 사용할 수 있는 통찰력을 활용할 수 있습니다. Google Analytics에 뛰어들 때 RegEx는 플랫폼의 단순한 소개 기능을 넘어서는 데 도움이 될 수 있습니다.
분석해 보겠습니다. Google Analytics와 정규 표현식이 SEO를 위해 함께 작동하는 방법과 Google 정규 표현식 검색이 데이터를 최적화하는 방법을 알아보세요.
검색 엔진 최적화를 위한 RegEx의 상위 12가지 용도
RegEx는 예를 들어 중복 콘텐츠를 식별하고 검색어와 가장 일치할 가능성이 가장 높은 앵커 텍스트를 찾는 등 분명한 용도를 가지고 있습니다. 그러나 RegEx가 SEO에 도움을 줄 수 있는 방법은 최소한 12가지가 있습니다. 다음은 정규 표현식의 가장 좋은 용도 중 일부입니다.
1. URL 분석
RegEx를 사용하여 URL을 분석하려는 것이 이상하게 보일 수 있지만 전자 상거래 시나리오를 생각해 보십시오. 모두 제품 페이지에 해당하는 수천 개의 개별 URL이 있을 가능성이 높습니다. 전환 데이터를 심층적으로 분석하고 소비자 활동에 해당하는 특정 URL을 필터링하는 기능은 매우 중요합니다.
이 데이터를 사용하여 고객이 보고 응답하는 URL과 그렇지 않은 URL을 식별할 수 있습니다. RegEx를 사용하면 URL 내부에 제품 카테고리나 이름과 같은 문자열을 사용하여 해당 URL 그룹에 대한 활동을 선택할 수 있습니다. 또한 사용자가 방문하는 URL 목록을 추적하여 고객 여정에 대한 명확한 이해를 개발하는 스마트 URL 분석을 수행할 수도 있습니다.
2. 키워드 분석 실시
RegEx를 사용하면 사람들이 검색하고 사이트를 찾고 참여하는 데 사용하는 키워드에 대해 더 자세히 알아볼 수 있습니다. 이는 콘텐츠 전략에 활용할 수 있는 틈새 검색, 전환율이 높은 문자열 및 전환을 유도하는 핵심 문구를 식별할 수 있는 강력한 도구입니다.
RegEx를 사용하면 탐욕적이거나 게으른 패턴을 사용하여 "포함" 또는 "동일"이라는 기존의 간단한 Google Search Console 도구를 사용하여 시각화하기 어려울 수 있는 문자열을 찾을 수 있습니다. 여기서는 매출 증대에 도움이 되는 높은 성과를 거두지만 때로는 찾기 어려운 롱테일 키워드를 찾을 수 있습니다.
3. 맞춤 채널 그룹 및 이벤트 만들기
Google은 또한 트래픽 소스 및 활동과 관련하여 카테고리를 제공하는 것을 좋아합니다. 플랫폼에는 이러한 채널을 통해 귀하의 사이트로 유입된 트래픽을 식별할 수 있는 사전 설정된 채널 그룹이 있습니다. 또한 기본 분석 전략에서 추적할 수 있는 "페이지 보기"와 같은 이벤트를 설정합니다.
RegEx를 사용하면 이 모든 분석 정보를 사용자 정의할 수 있습니다. '유럽 대륙의 앱 사용자로부터 유입되는 트래픽'과 같이 전략과 관련된 채널 그룹을 만들 수 있습니다. 이것의 이점은 분명합니다. 디지털 마케팅 전략의 성공을 이해하는 데 가장 중요한 기준으로 그룹을 설정할 수 있습니다.
4. 실적이 저조한 페이지 식별
수천 개의 URL이 있는 전자상거래 사이트에 대한 메모를 기억하시나요? 이는 많은 웹사이트 개발자의 일반적인 상태입니다. 웹사이트 페이지의 긴 색인과 어떤 페이지가 최고의 수익을 제공하는지 확인하기 위한 사용자 정의 가능한 분석이 필요합니다. 하지만 여기서 끝나지 않습니다. 일부 URL에는 오류가 있을 수 있기 때문입니다. 사용자의 활동 패턴은 다른 페이지와 다를 수 있습니다. 방문자가 전환하지 않거나 다른 페이지로 클릭하지 않을 수도 있습니다.
RegEx를 사용하면 이러한 페이지 각각에 연결된 활동에 대해 자세히 알아볼 수 있습니다. 이 데이터를 사용하여 오류 수정을 시작하거나 페이지 수준 분석을 수행할 수 있습니다.
이는 지속적인 유지 관리에 유용합니다. 또한 전략 수정이 효과적인 부분을 최적화하고 부족한 부분을 해결하는 데 도움이 될 수 있는지 확인하는 첫 번째 단계일 수도 있습니다.
5. 추천인 제외
Google Analytics 4의 트래픽 보고서는 일반적으로 모든 추천 소스를 캡처하지만 실제로 보고에서 일부 트래픽 추천을 제외하고 싶을 수도 있습니다. 클릭당 지불 캠페인을 운영하고 있다고 가정해 보겠습니다. 캠페인 성과를 추적하는 데 도움이 되는 트래픽 패턴은 다음과 같습니다.
- 광고 URL → 구매 확인 URL
이 예에서는 광고의 URL이 트래픽 소스입니다. 그러나 보다 일반적으로 분석에서 발생하는 패턴은 다음과 같습니다.
- 광고 URL → 결제 게이트웨이 → 구매 확인 URL
분석에서는 광고 URL을 구매 트래픽의 추천 소스로 식별하는 대신 결제 게이트웨이를 식별합니다. 고객이 다양한 소스에서 결제 게이트웨이에 도착할 수 있으므로 이는 분석 관점에서 볼 때 이상적이지 않습니다.
추천 제외를 사용하면 이 예의 결제 대행사와 같은 잠재적인 추천 소스를 분석에서 제거할 수 있습니다.
추천 제외는 GA4에서 RegEx를 사용하여 달성할 수 있습니다.
- '태그 설정 구성' 옵션을 찾습니다.
- '추천 도메인이 RegEx와 일치함'을 기준으로 추천을 제외하는 옵션을 선택하세요.
- RegEx 문자열을 입력하세요.
이런 방식으로 RegEx를 사용하면 보고에서 제외할 여러 도메인을 나열할 필요가 없다는 장점이 있습니다. RegEx 문자열을 간단히 식별할 수 있습니다.
6. 행동에 따라 사용자를 분류하여 잠재고객 생성
RegEx를 사용하여 사용자 정의 채널을 만드는 것과 마찬가지로 분석 데이터를 드릴다운하여 사용자 행동을 파악할 수 있습니다. 행동 세분화라고 하는 이 프로세스를 사용하면 특정 기준에 맞는 사용자를 세분화된 대상으로 나눌 수 있습니다.
이는 고객 여정, 이러한 사용자가 자주 사용하는 채널, 응답하는 메시지를 포괄하는 포괄적인 분석입니다. 잠재 고객을 분류하면 각 그룹에 대해 개별적으로 타겟팅된 디지털 마케팅 전략을 개발할 수 있습니다.
7. 지수 일관성 점검 수행
종종 개발자에게 맡겨지는 작업인 인덱스 일관성 검사는 로컬 사이트 인덱스가 관련 데이터베이스의 인덱스와 일치하는지 확인합니다. RegEx는 탐욕스러운 RegEx 또는 게으른 RegEx 패턴을 사용하여 둘 사이의 불일치를 식별하고 그에 따라 해결할 수 있으므로 이 작업에 탁월한 편의성과 기능을 제공합니다.
8. HTML 요소를 식별하여 콘텐츠 평가
기술적인 SEO의 일부는 검색 엔진이 웹사이트 코드를 쉽게 크롤링할 수 있도록 하는 것입니다. 코드는 일반적으로 잘 구조화되고 체계적으로 구성되어야 합니다. 코드가 너무 복잡하면 SEO에 부정적인 영향을 미칠 수 있습니다. RegEx는 웹사이트 전체에서 "투박한" 코드 문자열을 식별하여 최적화 과정에서 정리할 수 있도록 도와줍니다.
개발자는 결함을 검색하여 콘텐츠의 "백엔드" 품질을 평가할 수 있습니다. RegEx 명령을 사용하면 중복된 빈 줄, 누락된 공백 또는 너무 길 수 있는 코드 줄 길이와 같은 잘못된 코드 스타일 요소를 식별하는 데 도움이 될 수 있습니다.
이것은 수백 또는 수천 페이지의 웹 사이트가 있는 경우 RegEx가 시간을 절약해 주는 귀중한 도구인 또 다른 사건입니다.
9. '.Htaccess' 파일에서 스마트 리디렉션 만들기
".Htaccess" 파일은 한 페이지에서 다른 페이지로 자동 리디렉션을 일으키는 숨겨진 파일입니다. 새로운 제품 라인에 관한 두 가지 콘텐츠를 개발했다고 가정해 보겠습니다. 하나는 개발 프로세스에 대한 CEO와의 인터뷰이고 다른 하나는 제품 사양에 대한 분석입니다.
어쩌면 출시 한 달 후에 CEO 인터뷰를 내려놓고 싶을 수도 있습니다. RegEx를 사용하면 사람들을 해당 콘텐츠로 안내하는 검색 문자열을 식별하고 실제로 보기를 원하는 콘텐츠로 스마트 리디렉션을 제공할 수 있습니다.
10. 구매 후 고객 쿼리 찾기
디지털 마케팅 담당자는 전환 시점에서 작업이 종료된다고 가정할 수 있습니다. 그러나 구매 후 데이터는 고객의 구매 후 우려 사항과 경험에 대한 깊은 통찰력을 제공할 수 있습니다. 최근 고객의 생각은 제품의 작동 여부와 그러한 우려 사항에 사전에 대응할 수 있는 방법에 대해 많은 것을 말해 줄 수 있습니다.
귀하가 최첨단 진공청소기를 판매한다고 가정해 보겠습니다. 사람들이 "보증", "반품 기간", "작동하지 않음", "교체 부품" 및 "불만 사항"과 같은 주요 용어에 대한 정보를 찾고 있는지 알고 싶을 수 있습니다.
RegEx 쿼리를 사용하면 고객이 구매 후 조회할 수 있는 주요 용어를 식별하여 응답을 준비할 수 있습니다. 해당 응답은 고객 서비스 팀을 위한 일련의 Q&A일 수도 있고 반품 및 보증 정보를 제공하는 웹사이트의 관련 페이지일 수도 있습니다.
11. 브랜드 트래픽과 비브랜드 트래픽 비교
디지털 마케터에게 중요한 질문 중 하나는 제품, 서비스 또는 산업과 비교하여 브랜드 아이덴티티를 기준으로 사용자가 검색하는 세그먼트가 무엇인지입니다. "코카콜라"를 브랜드로 생각하면 "청량 음료", "탄산 음료", "소다" 또는 "가당"은 모두 코카콜라와 관련된 용어의 예입니다. 검색 트래픽에서 '코카콜라'와 '소다'는 모두 잠재적인 핵심 용어이지만 하나는 브랜드별로 관련되고 다른 하나는 그렇지 않습니다.
마케팅 담당자는 RegEx를 사용하여 브랜드 및 브랜드 관련 용어를 검색하는 방문자와 브랜드 관련이 아닌 용어를 검색하는 방문자를 구분할 수 있습니다. 이 예에서 '코카콜라', '콜라', '다이어트 콜라'는 모두 브랜드 핵심 용어입니다. 트래픽 유형을 구별하는 Google Search Console의 RegEx 보고서의 한 가지 예는 지정한 브랜드 용어를 "포함" 또는 "제외"하는 RegEx 쿼리입니다.
RegEx를 사용하는 방법에 따라 "포함" 보고서에는 이러한 브랜드 용어만 포함될 수도 있고 모든 용어가 포함될 수도 있습니다. 게으른 RegEx 패턴을 사용하면 브랜드 트래픽만 캡처할 수 있습니다. 탐욕스러운 RegEx 패턴을 사용하면 모든 것을 캡처할 수 있습니다.
12. 로그 파일 분석 수행
로그 파일에서 핵심 용어를 추출한다고 가정해 보겠습니다. RegEx를 사용하면 값이 각 로그 줄에 다른 순서로 표시되거나 각 로그 줄에 전혀 표시되지 않는 경우에도 이 작업을 효율적으로 수행할 수 있습니다. RegEx를 사용하면 데이터 분석과 관련된 로그를 식별하고 이를 사용하여 응집력 있는 보고서를 만들 수 있습니다.
RegEx의 유연성으로 인해 지연 패턴을 채택하여 반복 로그에서 중복을 제거할 수 있습니다. 기본적으로 RegEx 패턴은 탐욕적입니다. 필요한 경우 "*?"와 같은 특수 문자를 사용하여 게으른 패턴으로 검색을 제한합니다. 대신에 "*". 한 가지 팁은 더 복잡한 RegEx 패턴을 구현하기 전에 로그 구조에 대한 투명성을 제공하는 간단한 RegEx 쿼리로 시작하는 것입니다.