[python] 정규표현식을 이용한 문자열 분할하기

정규표현식을 사용하면 문자열을 특정 패턴에 따라 분할할 수 있습니다. 이렇게 분할된 문자열은 유용한 데이터 추출 작업에 사용될 수 있습니다. Python에서는 re 모듈을 사용하여 정규표현식을 적용할 수 있습니다.

정규표현식 패턴으로 문자열 분할하기

Python의 re 모듈을 사용하여 정규표현식 패턴을 적용하여 문자열을 분할해봅시다. 다음은 re.split() 함수를 사용하여 문자열을 분할하는 예제입니다.

import re

text = "Hello, world! How are you today?"
results = re.split(r"[,\s]", text)

print(results)

위의 코드에서는 ,와 공백을 기준으로 문자열을 분할하고 있습니다. 따라서 출력 결과는 다음과 같이 나옵니다.

['Hello', '', 'world!', 'How', 'are', 'you', 'today?']

정규표현식 패턴으로 문자열 분할하기 (그룹 활용)

정규표현식 패턴에서 그룹을 활용하여 복잡한 문자열을 분할할 수도 있습니다. 다음은 그룹을 사용하여 문자열을 분할하는 예제입니다.

import re

text = "John Doe | john.doe@example.com"
results = re.split(r"\s\|\s|\.", text)

print(results)

위의 코드에서는 |.을 기준으로 문자열을 분할하고 있습니다. 그룹을 사용하여 |.을 분할하기 때문에 출력 결과는 다음과 같이 나옵니다.

['John Doe', 'john', 'doe', 'example', 'com']

마무리

정규표현식을 이용하여 문자열을 분할하는 방법에 대해 알아보았습니다. 정규표현식을 잘 활용하면 복잡한 문자열에서 필요한 데이터를 추출하는 작업을 효율적으로 수행할 수 있습니다. Python의 re 모듈을 사용하여 문자열을 분할해보세요!