[파이썬] 정규 표현식의 매칭 결과 문자열 분리

정규 표현식을 사용하여 특정 패턴과 일치하는 문자열을 찾는 것은 매우 강력하고 유용한 방법입니다. 그러나 매칭된 결과에서 원하는 부분만 추출하고 싶을 때도 있습니다. Python의 re 모듈을 사용하여 정규 표현식의 매칭 결과 문자열을 간단하게 분리할 수 있습니다.

re 모듈

Python의 re 모듈은 정규 표현식과 관련된 기능을 제공합니다. 이 모듈을 사용하여 문자열 매칭, 패턴 검색, 문자열 분리 등 다양한 작업을 수행할 수 있습니다.

문자열 분리 예제

아래 예제는 정규 표현식을 사용하여 문자열에서 원하는 부분을 분리하는 방법을 보여줍니다.

import re

# 문자열과 정규 표현식 패턴 정의
string = "Hello #World, #Python is awesome!"
pattern = r"#(\w+)"

# 문자열에서 패턴과 일치하는 부분을 찾아 분리
result = re.split(pattern, string)

# 분리된 결과 출력
print(result)

위 예제에서는 정규 표현식 패턴인 #(\w+)을 사용하여 문자열 중 해시 태그(#)로 시작하는 단어를 분리합니다. 실행 결과는 다음과 같습니다.

['Hello ', 'World', ', ', 'Python', ' is awesome!']

분리된 결과는 리스트 형태로 반환되는데, 매칭된 부분 이전과 이후의 문자열이 각각 요소로 들어가게 됩니다. 정규 표현식의 그룹((\w+))에 일치하는 문자열은 각각 따로 요소로 추가되어 출력됩니다.

정리

Python의 re 모듈을 사용하면 정규 표현식의 매칭 결과 문자열을 간단하게 분리할 수 있습니다. 이를 활용하여 문자열 중 원하는 부분만 추출하여 사용할 수 있습니다. 정규 표현식은 다양한 패턴 매칭과 문자열 처리 작업에서 유용하게 사용될 수 있는 강력한 도구입니다.