[python] 정규표현식을 이용한 문자열 분할하기
정규표현식을 사용하면 문자열을 특정 패턴에 따라 분할할 수 있습니다. 이렇게 분할된 문자열은 유용한 데이터 추출 작업에 사용될 수 있습니다. Python에서는 re
모듈을 사용하여 정규표현식을 적용할 수 있습니다.
정규표현식 패턴으로 문자열 분할하기
Python의 re
모듈을 사용하여 정규표현식 패턴을 적용하여 문자열을 분할해봅시다. 다음은 re.split()
함수를 사용하여 문자열을 분할하는 예제입니다.
import re
text = "Hello, world! How are you today?"
results = re.split(r"[,\s]", text)
print(results)
위의 코드에서는 ,
와 공백을 기준으로 문자열을 분할하고 있습니다. 따라서 출력 결과는 다음과 같이 나옵니다.
['Hello', '', 'world!', 'How', 'are', 'you', 'today?']
정규표현식 패턴으로 문자열 분할하기 (그룹 활용)
정규표현식 패턴에서 그룹을 활용하여 복잡한 문자열을 분할할 수도 있습니다. 다음은 그룹을 사용하여 문자열을 분할하는 예제입니다.
import re
text = "John Doe | john.doe@example.com"
results = re.split(r"\s\|\s|\.", text)
print(results)
위의 코드에서는 |
와 .
을 기준으로 문자열을 분할하고 있습니다. 그룹을 사용하여 |
과 .
을 분할하기 때문에 출력 결과는 다음과 같이 나옵니다.
['John Doe', 'john', 'doe', 'example', 'com']
마무리
정규표현식을 이용하여 문자열을 분할하는 방법에 대해 알아보았습니다. 정규표현식을 잘 활용하면 복잡한 문자열에서 필요한 데이터를 추출하는 작업을 효율적으로 수행할 수 있습니다. Python의 re
모듈을 사용하여 문자열을 분할해보세요!