[python] NLTK를 사용해 텍스트의 부사를 추출하는 방법은 무엇인가요?

30 Nov 2023

필요한 패키지를 가져오세요:

import nltk
from nltk.tag import pos_tag

텍스트를 토큰화하고 품사 태깅을 수행하세요:

text = "I walked slowly to the park yesterday."
tokens = nltk.word_tokenize(text)
tagged = pos_tag(tokens)

품사 태그에서 동사를 추출하세요:

adverbs = [word for word, tag in tagged if tag.startswith('R')]

위의 코드를 실행하면 “slowly”라는 부사가 추출되어 출력될 것입니다.

추가로, NLTK는 영어에 대한 품사 태그를 제공하기 때문에 다른 언어에 대해서는 다른 패키지나 접근 방법을 사용해야 할 수도 있습니다.

참고문헌:

NLTK documentation: https://www.nltk.org/
Penn Treebank POS Tags: https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html