스프레드시트, 메이크, 루커 스튜디오 등 노코드 툴을 활용하다 보면 원하는 형식으로 데이터가 입력되지 않아 불편한 경우가 많습니다.
특히 데이터를 가공하거나 텍스트에서 특정 부분만 추출하고 싶을 때 REGEX(정규 표현식)는 매우 유용한 도구입니다.
이번 글에서는 REGEX의 기본 개념부터 스프레드시트 및 다양한 노코드 툴에서 REGEX를 사용하는 방법, 주요 활용 사례, 그리고 텍스트 데이터를 자유자재로 가공하기 위한 구체적인 팁까지 제공하겠습니다.
👇✅ REGEX란 무엇인가 정규 표현식의 정의와 개념
REGEX의 정의
REGEX(Regular Expression)는 특정 패턴에 맞는 텍스트를 검색하고 처리하기 위한 규칙 기반의 언어입니다.
텍스트 데이터를 다룰 때 복잡한 검색, 대체 작업 등을 자동화하는 데 매우 유용합니다.
활용 가능한 분야
- 데이터 추출 특정 규칙에 따라 데이터를 필터링
- 유효성 검증 이메일, 전화번호 등의 포맷 확인
- 텍스트 수정 데이터를 일관된 형식으로 정리
REGEX의 기본 요소
- 문자: 정규 표현식에서 특정 문자나 패턴을 검색
- 와일드카드(.): 임의의 한 문자를 의미
- 플러스(+): 바로 앞 문자가 한 번 이상 반복됨을 의미
- 꺾쇠(^): 텍스트의 시작 부분을 지정
- 달러($): 텍스트의 끝 부분을 지정
✅ REGEX의 주요 기능 데이터 추출, 검증, 수정
REGEX의 3대 기능
| 기능 | 설명 | 주요 함수 |
|---|---|---|
| 데이터 추출 | 특정 패턴의 텍스트를 찾아 반환 | REGEXEXTRACT |
| 유효성 검증 | 텍스트가 규칙에 맞는지 확인 | REGEXMATCH |
| 텍스트 수정 | 텍스트를 특정 형식으로 변환 | REGEXREPLACE |
✅ REGEXEXTRACT로 원하는 데이터 추출하기
기본 사용법
- 셀에서 특정 텍스트를 추출하려면 REGEXEXTRACT 함수를 사용합니다.
- 예시: =REGEXEXTRACT(B3, "울산 광역시")
- 이 수식은 B3 셀에서 "울산 광역시"라는 텍스트를 추출합니다.
응용 예제
주소 데이터에서 "광역시"로 끝나는 값만 추출하려면 다음과 같은 패턴을 사용합니다:
- 패턴: ^.*광역시$
- 설명: 시작(^)과 끝($)에서 "광역시"로 끝나는 텍스트를 찾습니다.
- 예시: "울산 광역시"는 추출되지만, "서울 특별시"는 추출되지 않습니다.
실제 사용 사례
- 고객 데이터에서 이메일 도메인만 추출하기
- 전화번호에서 국번만 분리하기
✅ REGEXMATCH로 데이터 유효성 검증
REGEXMATCH란
REGEXMATCH는 텍스트가 특정 패턴에 맞는지 확인하여 TRUE 또는 FALSE를 반환합니다.
예제
- 이메일 주소가 올바른 형식인지 확인하려면 다음과 같은 패턴을 사용합니다:
- 수식: =REGEXMATCH(B3, "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$")
- 결과: 올바른 이메일 형식은 TRUE, 그렇지 않으면 FALSE
활용 팁
- 전화번호 포맷(예: "010-1234-5678")을 검증할 때 사용
- 날짜 형식(예: "YYYY-MM-DD") 확인
✅ REGEXREPLACE로 데이터 수정
REGEXREPLACE란
REGEXREPLACE는 텍스트에서 특정 패턴을 찾아 원하는 형식으로 변경합니다.
응용 예제
| 원본 | 패턴 | 변경 결과 |
|---|---|---|
| 01012345678 | (\d{3})(\d{4})(\d{4}) | 010-1234-5678 |
활용 팁
- 날짜 형식을 "YYYY-MM-DD"로 변환
- 주소 데이터에서 불필요한 문자를 제거
✅ 노코드 툴에서 REGEX 활용 사례
메이크
- 자동화 워크플로에서 REGEX로 이메일 아이디만 추출
- 모듈 설정에서 REGEXEXTRACT 패턴 활용
루커 스튜디오
- 대시보드 필드 생성 시 REGEXREPLACE로 데이터 정리
- 예: 전화번호 형식 일관성 유지
스프레드시트
- 대규모 데이터에서 특정 값을 빠르게 추출
- 조건부 서식 규칙으로 유효성 검증