구글 서치 콘솔 정규표현식(Regex) 필터 활용법: SEO 키워드 분석 패턴

구글 서치 콘솔 정규표현식(Regex) 필터 활용법: SEO 키워드 분석 패턴

웹사이트로 유입되는 자연 검색 트래픽을 관리하고 구글 상위 노출 기회를 발굴하기 위해 구글 서치 콘솔(Google Search Console, GSC) 성능 보고서를 들여다보는 마케터나 SEO 담당자들은 금세 한계에 봉착합니다. 서치 콘솔이 기본 제공하는 검색 필터는 단일 키워드의 "포함", "제외", "일치" 수준만 지원하기 때문에, 복합적인 검색 의도를 묶어서 분석하거나 불필요한 키워드들을 일괄 필터링하기 어렵기 때문입니다.

이러한 수작업 분석의 비효율을 혁신하는 강력한 도구가 바로 맞춤 설정 정규표현식(Regex) 필터 기능입니다. 구글 서치 콘솔은 분석용 쿼리 및 페이지 URL 필터링에 글로벌 표준 정규식 문법인 RE2 구문을 공식 지원합니다. 정규표현식을 적재적소에 활용하면 질문형 키워드를 추출하여 새로운 블로그 글감을 기획하거나, 자사 브랜드 키워드를 도려내 순수 비브랜드 유입만 정밀 분석하는 등 고급 SEO 데이터 세그멘테이션이 가능해집니다. 본 가이드에서는 실무에서 즉시 활용할 수 있는 핵심적인 GSC 정규식 필터 패턴들을 총망라해 드립니다.


1. 구글 서치 콘솔 정규식(Regex) 핵심 기호 및 가이드

구글 서치 콘솔의 성능(실적) 메뉴에서 **[+새로 만들기] → [검색어] 또는 [페이지]**를 선택한 후, 첫 번째 드롭다운을 **[맞춤설정(정규표현식)]**으로 변경하면 정규식 필터를 적용할 수 있습니다. 서치 콘솔은 전체 일치 방식이 아니라 **부분 매칭(Sub-string match)**을 기본값으로 취급하므로, 핵심 메타 문자들을 조합해 정밀한 범위를 한정해야 오탐을 줄일 수 있습니다.

메타 문자 정규식 문법 역할 GSC 실무 적용 예시
**` `** OR (또는): 여러 단어 중 하나라도 매칭할 때 사용
^ 문장 시작점: 쿼리의 가장 첫 글자와 매칭 ^어떻게 ("어떻게"로 시작하는 질문형 검색어만 매칭)
$ 문장 끝점: 쿼리의 마지막 글자와 매칭 방법$ ("방법"으로 끝나는 튜토리얼 쿼리만 매칭)
.* 임의의 문자열: 임의 개수의 문자 매칭 /blog/.* (블로그 하위 경로의 모든 URL 필터링)
\s 공백(Space): 띄어쓰기 한 칸 매칭 \b 경계 또는 단어 카운트 시 조합하여 유용하게 활용

2. 실무에서 바로 쓰는 구글 서치 콘솔 정규식 패턴 5선

SEO 마케터와 콘텐츠 기획자가 실무 성능 보고서 분석 시 즉시 복사해서 사용할 수 있는 5가지 필수 정규식 패턴 모음입니다.

1) 질문형 검색어 추출 패턴 (블로그 글감 및 FAQ 기획)

유저가 해결하고 싶어 하는 문제나 궁금증을 나타내는 질문형 키워드들을 일괄 추출합니다. 이를 통하면 신규 칼럼 기획이나 페이지 내 FAQ 섹션 고도화에 쓰일 핵심 롱테일 키워드를 빠르게 수집할 수 있습니다.

  • 정규식 패턴: ^(어떻게|왜|언제|어디서|누가|무엇|어떤|추천|차이|비교|방법)\s
  • 설명: 문장의 첫 단어가 지정된 한글 의문사나 기획성 단어로 시작하고 뒤이어 공백(\s)이 나오는 쿼리들을 모아서 보여줍니다.

2) 브랜드 검색어 발라내기 (순수 비브랜드 트래픽 분석)

도메인 이름이나 회사 브랜드명을 포함한 검색 유입(Branded)은 제품이나 서비스 인지도 덕에 들어오는 트래픽입니다. 순수한 SEO 성능(콘텐츠 검색 노출 성과)을 평가하려면 브랜드 키워드를 차단해야 합니다.

  • 정규식 패턴: 핸디웹|handyweb|handyweb\.tools
  • 사용법: GSC 정규식 필터 설정에서 **"정규표현식과 일치하지 않음(Doesn't match regex)"**을 선택하고 위 식을 넣으면 자사 브랜드 유입을 완전히 발라낸 유입 데이터를 볼 수 있습니다.

3) 검색 구매 의도 분류 패턴 (사용자 인텐트 세그멘테이션)

방문자가 구매 직전 상태인지(Transactional), 혹은 단순 정보 수집용인지(Informational) 분류하여 랜딩 페이지의 콘텐츠 방향성을 교정할 수 있습니다.

  • 구매 의도 패턴 (Transactional): \b(가격|비용|구매|예약|할인|쿠폰|다운로드|무료)\b
  • 정보 수집 패턴 (Informational): \b(가이드|원리|정의|사례|예제|치트시트|분석)\b

4) 특정 단어 갯수 이상의 롱테일 키워드 필터링

단어가 3개 또는 4개 이상 연결된 구체적인 검색어(Long-tail keyword)는 경쟁도가 낮고 구매 전환율이 매우 높습니다. 롱테일 검색어의 노출 수 대비 클릭률을 추적할 때 유용합니다.

  • 단어 3개 이상 롱테일 패턴: ^[^\s]+\s+[^\s]+\s+[^\s]+
  • 설명: 공백이 아닌 문자열 더미와 띄어쓰기가 최소 2번 이상 연속되는 쿼리 구조를 필터링하여 최소 3단어 이상으로 이루어진 다중 단어 검색어만 보여줍니다.

3. 자주 묻는 질문 (FAQ)

Q1. 서치 콘솔 정규식 필터에서 대소문자는 어떻게 구분하나요?

구글 서치 콘솔에 등록하는 정규식(Regex) 문법은 기본적으로 대소문자를 구분하지 않습니다(Case-insensitive). 따라서 Googlegoogle을 별도로 파이프(|) 기호로 매칭할 필요 없이 하나만 적어두면 대소문자 무관하게 전체 매칭을 수행합니다.

Q2. 작성한 정규식이 올바른지 사전에 테스트하는 방법이 있나요?

구글 서치 콘솔은 RE2 표준 라이브러리를 채택하여 가볍고 안전한 검색을 지원합니다. 내가 짠 정규식이 정상 작동하는지 확인하고 싶다면 무료 테스트 사이트인 Regex101에 접속하여 우측 상단 문법 버전을 **golang(RE2)**으로 맞추고 대상 키워드들을 넣어 사전 검증해 볼 수 있습니다.


4. 정규표현식 실력 업그레이드 및 도구 테스트

구글 서치 콘솔에 복합 필터를 적용하기 전에 정규식 패턴이 구글 봇의 기준과 내 사이트 쿼리에 매칭되는지 안전하게 검증해 보아야 합니다.

저희가 제공하는 정규표현식 테스터 도구를 사용하시면, 브라우저 로컬 환경 내에서 입력한 검색 키워드 패킷 텍스트를 실시간 매칭해 하이라이트로 검증할 수 있습니다. 정규식의 완전한 기본 기호와 백레퍼런스 등의 심화 문법을 학습하고 싶다면 정규표현식 문법 치트시트 가이드를 참고하여 유연한 SEO 전문가로 거듭나 보시기 바랍니다.

함께 보면 좋은 글

목록으로 돌아가기