[python] 정규표현식을 이용한 특정 문자열 포함된 모든 문자열 추출하기

정규표현식은 문자열에서 특정 패턴을 찾고 추출하는데 매우 유용한 도구입니다. 특히 특정 문자열을 포함한 모든 문자열을 추출하고 싶을 때 정규표현식을 사용할 수 있습니다.

필요한 패키지 설치

re라는 내장 라이브러리를 사용하여 정규표현식을 처리할 수 있습니다. 따라서 먼저 re 패키지를 설치해야합니다. 다음 명령을 사용하여 설치합니다.

pip install re

특정 문자열 포함된 모든 문자열 추출하기

다음은 주어진 문자열에서 특정 문자열을 포함한 모든 문자열을 추출하는 예제 코드입니다.

import re

def extract_strings_with_pattern(string, pattern):
    result = re.findall(pattern, string)
    return result

string = "apple banana cherry applepie grape"
pattern = r"\b[a-z]*apple[a-z]*\b"

result = extract_strings_with_pattern(string, pattern)
print(result)  # ['apple', 'applepie']

위의 코드에서 extract_strings_with_pattern 함수는 주어진 문자열과 정규표현식 패턴을 입력으로 받아 패턴에 매칭되는 모든 문자열을 추출하여 반환합니다. re.findall 함수를 사용하여 패턴과 문자열을 비교하여 매칭되는 부분을 찾을 수 있습니다.

위의 예제에서는 apple이라는 문자열을 포함하는 모든 문자열을 추출하는 패턴을 사용했습니다. 패턴 \b[a-z]*apple[a-z]*\bapple 앞뒤로 알파벳 소문자가 포함된 단어를 찾습니다.

테스트 문자열 “apple banana cherry applepie grape”에서 apple을 포함하는 문자열은 “apple”과 “applepie”입니다. 따라서 위의 코드는 ['apple', 'applepie']를 반환합니다.

마무리

위의 예제를 통해 정규표현식을 사용하여 특정 문자열을 포함한 모든 문자열을 추출하는 방법을 알아보았습니다. 정규표현식은 강력한 패턴 매칭 도구이므로 다양한 상황에서 유용하게 사용할 수 있습니다. 자세한 정규표현식 문법과 활용에 대해서는 Python 공식 문서를 참고하시기 바랍니다.