[python] 정규표현식을 이용한 범위 기호 이용 문자열 추출

정규표현식(regular expression)은 문자열에서 패턴을 찾고 추출하기 위해 사용되는 강력한 도구입니다. 이를 이용하면 특정한 문자열 패턴을 가진 문자열을 쉽게 추출할 수 있습니다. 이번에는 범위 기호(range symbol)를 이용한 문자열 추출에 대해 알아보겠습니다.

범위 기호([ ])

정규표현식에서 범위 기호 [ ]는 여러 문자 중 하나를 선택하기 위해 사용됩니다. 예를 들어, [abc]는 ‘a’, ‘b’, ‘c’ 중 하나의 문자와 일치하는 문자열을 추출합니다.

문자열 추출 예제

다음은 범위 기호를 이용하여 특정 문자열을 추출하는 예제입니다.

import re

# 추출할 문자열
text = "I love apples and bananas."

# [a-z] 범위 기호를 이용하여 소문자 알파벳 문자열 추출
result = re.findall("[a-z]+", text)
print(result)  # ['love', 'apples', 'and', 'bananas']

# [a-z]+[a-z]+[a-z] 범위 기호를 이용하여 3개의 연속된 소문자 알파벳 문자열 추출
result = re.findall("[a-z]+[a-z]+[a-z]+", text)
print(result)  # ['apples']

# [a-z][a-z] 범위 기호를 이용하여 2개의 연속된 소문자 알파벳 문자열 추출
result = re.findall("[a-z][a-z]", text)
print(result)  # ['lo', 've', 'ap', 'pl', 'es', 'an', 'an', 'as']

# [a-z][a-z][a-z] 범위 기호를 이용하여 3개의 연속된 소문자 알파벳 문자열 추출
result = re.findall("[a-z][a-z][a-z]", text)
print(result)  # ['lov', 'app', 'les', 'and', 'ban']

위 코드에서는 re.findall() 함수를 사용하여 정규표현식 패턴에 일치하는 모든 문자열을 추출하고 출력하였습니다. 결과를 보면 범위 기호를 이용하여 소문자 알파벳 문자열을 추출하는 것을 확인할 수 있습니다.

참고 자료