[python] 정규표현식을 이용한 반복 문자열 추출

정규표현식은 문자열에서 원하는 패턴을 찾아내기 위해 사용되는 강력한 도구입니다. 이번 포스트에서는 파이썬에서 정규표현식을 이용하여 반복된 문자열을 추출하는 방법에 대해 알아보겠습니다.

정규표현식 패턴 작성하기

먼저, 반복된 문자열을 추출하기 위해 필요한 정규표현식 패턴을 작성해야 합니다. 예를 들어, “hello”, “world”와 같이 같은 문자열이 반복되는 경우에 해당하는 패턴은 다음과 같을 수 있습니다.

import re

pattern = r"(\w+)\1+"

위의 예제에서 r"(\w+)\1+" 패턴은 \w+에 해당하는 문자열이 1번 이상 반복되는 경우를 의미합니다.

문자열에서 반복 문자열 추출하기

이제 작성한 정규표현식 패턴을 이용하여 문자열에서 반복된 문자열을 추출해보겠습니다.

text = "hellohello worldworld"

result = re.findall(pattern, text)
print(result)

위의 예제에서 re.findall(pattern, text) 함수는 문자열 text에서 패턴에 해당하는 모든 반복 문자열을 추출하여 리스트로 반환합니다. 따라서 위의 예제에서는 ['hello', 'world']라는 결과를 출력합니다.

정리

정규표현식을 이용하여 반복된 문자열을 추출하는 방법에 대해 알아보았습니다. 이를 활용하면 텍스트 처리나 문자열 분석에서 반복된 패턴을 찾아낼 수 있습니다. 더 복잡한 패턴을 작성하고 다양한 예제를 실험해보면서 정규표현식을 다양하게 활용해보세요!

참고 문서: