[python] 정규표현식을 이용한 문장 추출하기

정규표현식(regular expression)은 특정한 패턴을 찾고 추출하기 위해 많이 사용되는 도구입니다. 이번 포스트에서는 Python에서 정규표현식을 이용하여 문장을 추출하는 방법에 대해 알아보겠습니다.

문장 추출하기

다음은 주어진 텍스트에서 문장을 추출하는 코드입니다.

import re

text = "안녕하세요? 반갑습니다. 오늘은 정규표현식에 대해 배우고 있습니다."
sentences = re.split(r'[.?!]', text)

for sentence in sentences:
    if sentence.strip():
        print(sentence.strip())

위의 코드는 다음과 같이 동작합니다.

  1. re.split() 함수를 사용하여 문장 구분자(.?!)를 기준으로 텍스트를 나눕니다.
  2. 각 문장마다 strip() 함수를 사용하여 공백을 제거합니다.
  3. 공백이 아닌 문장만 출력합니다.

이를 실행하면 다음과 같은 결과가 출력됩니다.

안녕하세요
반갑습니다
오늘은 정규표현식에 대해 배우고 있습니다

이와 같이 정규표현식을 이용하여 주어진 텍스트에서 문장을 추출할 수 있습니다.

정규표현식 패턴 설명

문장을 추출하기 위해 사용된 정규표현식 패턴에 대해 설명하겠습니다.

위의 패턴을 결합하여 문장을 추출하는 것이 가능합니다.

참고문서

위의 링크에서 더 많은 정보 및 예제를 확인할 수 있습니다.