[python] 정규표현식을 이용한 소괄호 안의 문자열 추출하기

정규표현식은 문자열에서 특정한 패턴을 찾기 위해 사용되는 강력한 도구입니다. 이를 이용하면 문자열에서 원하는 부분을 쉽게 추출할 수 있습니다. 이번 글에서는 Python에서 소괄호 안에 있는 문자열을 추출하는 방법에 대해 알아보겠습니다.

정규표현식 패턴 만들기

먼저, 소괄호 안의 문자열을 추출하기 위한 정규표현식 패턴을 만들어야 합니다. Python에서는 re 모듈을 이용하여 정규표현식을 적용할 수 있습니다. 아래는 소괄호 안의 문자열을 추출하기 위한 정규표현식 패턴입니다.

import re

def extract_text_in_parentheses(text):
    pattern = r"\((.*?)\)"
    result = re.findall(pattern, text)
    return result

위 코드에서 pattern 변수에는 \((.*?)\) 패턴을 할당하고 있습니다. 이 패턴은 소괄호 안의 문자열을 추출하는 역할을 합니다. re.findall() 함수를 사용하면 입력된 텍스트에서 모든 소괄호 안의 문자열을 추출할 수 있습니다.

예제 사용법

text = "안녕하세요, (반갑습니다) 저는 (AI 어시스턴트)입니다."
result = extract_text_in_parentheses(text)
print(result)

위 예제에서는 text 변수에 추출하고 싶은 문자열을 지정하고 있습니다. 따라서 소괄호 안의 문자열인 “반갑습니다”와 “AI 어시스턴트”가 출력됩니다.

결론

정규표현식은 Python에서 문자열 처리를 위해 많이 사용되고 있습니다. 소괄호 안의 문자열을 추출하는 방법을 알고 있다면, 텍스트 분석이나 데이터 전처리 작업에서 유용하게 활용할 수 있습니다.