[python] 정규표현식을 이용한 모든 문자열 추출하기

정규표현식은 문자열에서 특정 패턴을 찾거나 추출하기 위해 사용되는 강력한 도구입니다. 이번 포스트에서는 Python의 re 모듈을 사용하여 정규표현식을 이용해 모든 문자열을 추출하는 방법을 알아보겠습니다.

1. 모듈 임포트하기

먼저, re 모듈을 임포트해야 합니다. 아래와 같이 import re를 추가해주세요:

import re

2. 정규표현식 패턴 작성하기

추출하고 싶은 문자열 패턴을 정규표현식으로 작성해야 합니다. 예를 들어, 모든 소문자로 이루어진 문자열을 추출하고 싶다면 [a-z]+와 같은 패턴을 작성할 수 있습니다.

3. 문자열에서 패턴 추출하기

작성한 패턴을 사용하여 문자열에서 원하는 부분을 추출할 수 있습니다. 이를 위해 re.findall() 메서드를 사용합니다. 아래의 예제 코드를 참고해주세요:

import re

# 패턴 작성
pattern = r'[a-z]+'

# 대상 문자열
text = "Hello, World! This is a test."

# 패턴 추출
result = re.findall(pattern, text)
print(result)

위 코드를 실행하면 다음과 같은 결과가 출력됩니다:

['ello', 'orld', 'his', 'is', 'a', 'test']

이렇게 추출된 모든 문자열은 리스트 형태로 반환됩니다.

4. 참고 자료