[python] NLTK를 사용해 텍스트의 강조를 분석하는 방법은 무엇인가요?

30 Nov 2023

python

첫째로, NLTK를 설치해야 합니다. pip 명령어를 사용하여 쉽게 설치할 수 있습니다.

pip install nltk

둘째로, NLTK의 강조 분석 기능을 사용하기 위해 필요한 데이터를 다운로드해야 합니다. 터미널에서 Python 인터프리터를 실행하고 다음과 같은 코드를 실행하여 데이터를 다운로드할 수 있습니다.

import nltk

nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')

이제 강조 분석 기능을 사용할 준비가 되었습니다. 다음은 NLTK를 사용하여 텍스트의 강조를 분석하는 간단한 예제입니다.

import nltk

def analyze_emphasis(text):
    # 텍스트를 문장으로 분리합니다.
    sentences = nltk.sent_tokenize(text)

    for sentence in sentences:
        # 문장을 단어로 분리합니다.
        words = nltk.word_tokenize(sentence)
        # 단어에 품사 태깅을 수행합니다.
        tagged_words = nltk.pos_tag(words)

        for word, tag in tagged_words:
            if tag == 'JJ':
                # 형용사(JJ)인 경우, 강조된 단어로 인식합니다.
                print(f"강조된 단어: {word} (품사: {tag})")

text = "파이썬은 정말 멋진 언어입니다."
analyze_emphasis(text)

위의 예제에서는 NLTK를 사용하여 텍스트를 문장으로 분리하고, 각 문장을 단어로 분리한 후 품사 태깅을 수행합니다. 품사 태그 중 형용사(JJ)인 경우, 해당 단어를 강조된 단어로 간주합니다. 위의 예제에서는 “멋진”이 강조된 단어로 인식됩니다.

이것은 간단한 예제일 뿐이며, NLTK는 더 정교한 강조 분석 기능을 제공합니다. 자세한 내용은 NLTK 공식 문서를 참조하시기 바랍니다.