[파이썬] `textblob`에서 정규 표현식 사용
정규 표현식(Regular Expressions)은 텍스트에서 특정한 패턴을 찾거나 검색, 치환하는 데 사용되는 강력하고 유연한 도구입니다. textblob
은 파이썬에서 텍스트 처리와 자연어 처리를 위한 라이브러리로, 정규 표현식을 사용하여 다양한 작업을 수행할 수 있습니다.
textblob
은 다음과 같은 기능을 제공합니다:
- 텍스트에 정규 표현식을 적용하여 패턴을 찾는 기능
- 텍스트에서 패턴을 추출하거나 변환하는 기능
- 텍스트를 토큰화하고, 문장을 분리하는 등의 작업을 수행하는 기능
다음은 textblob
에서 정규 표현식을 사용하는 예시 코드입니다:
from textblob import TextBlob
# 텍스트 생성
text = "I love coding! Code is my passion."
# 정규 표현식을 사용하여 코드를 찾는 예제
pattern = r'code' # 정규 표현식 패턴
blob = TextBlob(text)
matches = blob.words.match(pattern) # 패턴과 일치하는 단어 찾기
print(matches) # 결과 출력: ['code', 'code']
# 정규 표현식을 사용하여 치환하는 예제
replacement = 'programming' # 치환할 단어
replaced = blob.words.replace(pattern, replacement) # 패턴과 일치하는 단어를 치환
print(replaced) # 결과 출력: ['I', 'love', 'coding!', 'programming', 'is', 'my', 'passion.']
위의 예시에서는 TextBlob
객체를 생성한 후, match()
메서드를 사용하여 텍스트에서 정규 표현식 패턴과 일치하는 단어를 찾았습니다. 또한, replace()
메서드를 사용하여 해당 패턴을 다른 단어로 치환했습니다.
textblob
의 TextBlob
클래스는 더 많은 텍스트 처리 기능을 제공하므로, 정규 표현식을 사용하여 다양한 작업을 수행할 수 있습니다. 자세한 내용은 공식 문서를 참조하시기 바랍니다.
참고 자료: textblob 공식 문서