[python] NLTK를 사용해 텍스트의 부사를 추출하는 방법은 무엇인가요?
- 필요한 패키지를 가져오세요:
import nltk from nltk.tag import pos_tag
- 텍스트를 토큰화하고 품사 태깅을 수행하세요:
text = "I walked slowly to the park yesterday." tokens = nltk.word_tokenize(text) tagged = pos_tag(tokens)
- 품사 태그에서 동사를 추출하세요:
adverbs = [word for word, tag in tagged if tag.startswith('R')]
- 추출된 부사를 출력하거나 다른 용도로 사용하세요:
print(adverbs)
위의 코드를 실행하면 “slowly”라는 부사가 추출되어 출력될 것입니다.
추가로, NLTK는 영어에 대한 품사 태그를 제공하기 때문에 다른 언어에 대해서는 다른 패키지나 접근 방법을 사용해야 할 수도 있습니다.
참고문헌:
- NLTK documentation: https://www.nltk.org/
- Penn Treebank POS Tags: https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html