[python] 정규표현식을 이용한 소괄호 안의 문자열 추출

정규표현식은 문자열에서 패턴을 찾고 추출하는 데 강력한 도구입니다. 이를 사용하여 소괄호 안의 문자열을 추출하는 방법을 알아보겠습니다.

파이썬에서는 re 모듈을 사용하여 정규표현식을 처리할 수 있습니다. 다음은 소괄호 안의 문자열을 추출하는 예제 코드입니다.

import re

def extract_string_in_parenthesis(text):
    pattern = r"\((.*?)\)"
    matches = re.findall(pattern, text)
    
    return matches

위의 코드에서 extract_string_in_parenthesis 함수는 입력된 텍스트에서 소괄호 안의 문자열을 추출하는 함수입니다. 정규표현식 패턴으로는 \((.*?)\)을 사용했습니다. 이 패턴은 (로 시작하고 )로 끝나는 문자열을 추출합니다. .*?는 임의의 문자열을 의미하며, ?는 최소 매칭(non-greedy)을 의미합니다.

함수를 호출할 때 텍스트를 전달하면 소괄호로 둘러싸인 문자열이 반환됩니다. 예를 들어, 다음은 함수를 호출한 결과입니다.

text = "안녕하세요 (Python) 정규표현식을 (사용)하는 예제입니다."
result = extract_string_in_parenthesis(text)
print(result)  # ['Python', '사용']

위의 예제에서는 주어진 텍스트에서 소괄호로 둘러싸인 문자열인 ‘Python’과 ‘사용’을 추출한 결과를 출력합니다.

정규표현식을 사용하면 복잡한 문자열에서 원하는 정보를 추출하는 데 유용합니다. 하지만 패턴을 작성하는 데 주의해야 하며, 다양한 예외 상황을 고려하여 코드를 작성해야 합니다.

더 자세한 정보는 파이썬 공식 문서에서 정규표현식에 관한 내용을 찾아볼 수 있습니다.

정규표현식을 이용하여 소괄호 안의 문자열을 추출하는 방법에 대해 알아보았습니다. 이를 활용하여 복잡한 문자열을 처리할 때 유용하게 활용할 수 있습니다.