[python] NLTK를 사용해 텍스트의 강조를 분석하는 방법은 무엇인가요?
첫째로, NLTK를 설치해야 합니다. pip 명령어를 사용하여 쉽게 설치할 수 있습니다.
pip install nltk
둘째로, NLTK의 강조 분석 기능을 사용하기 위해 필요한 데이터를 다운로드해야 합니다. 터미널에서 Python 인터프리터를 실행하고 다음과 같은 코드를 실행하여 데이터를 다운로드할 수 있습니다.
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
이제 강조 분석 기능을 사용할 준비가 되었습니다. 다음은 NLTK를 사용하여 텍스트의 강조를 분석하는 간단한 예제입니다.
import nltk
def analyze_emphasis(text):
# 텍스트를 문장으로 분리합니다.
sentences = nltk.sent_tokenize(text)
for sentence in sentences:
# 문장을 단어로 분리합니다.
words = nltk.word_tokenize(sentence)
# 단어에 품사 태깅을 수행합니다.
tagged_words = nltk.pos_tag(words)
for word, tag in tagged_words:
if tag == 'JJ':
# 형용사(JJ)인 경우, 강조된 단어로 인식합니다.
print(f"강조된 단어: {word} (품사: {tag})")
text = "파이썬은 정말 멋진 언어입니다."
analyze_emphasis(text)
위의 예제에서는 NLTK를 사용하여 텍스트를 문장으로 분리하고, 각 문장을 단어로 분리한 후 품사 태깅을 수행합니다. 품사 태그 중 형용사(JJ)인 경우, 해당 단어를 강조된 단어로 간주합니다. 위의 예제에서는 “멋진”이 강조된 단어로 인식됩니다.
이것은 간단한 예제일 뿐이며, NLTK는 더 정교한 강조 분석 기능을 제공합니다. 자세한 내용은 NLTK 공식 문서를 참조하시기 바랍니다.