파이썬을 사용한 트위터 Sentiment analysis 알고리즘 개발

04 Oct 2023

python

개요

이 블로그 포스트에서는 파이썬을 사용하여 트위터 Sentiment Analysis(감정 분석) 알고리즘을 개발하는 방법을 알아보겠습니다. Sentiment Analysis는 텍스트 데이터에서 문장의 긍정적인 부정적인 의미를 추출하는 기술로, 소셜 미디어를 포함한 다양한 플랫폼에서 감정 분석을 이용해 사용자 의견을 파악할 수 있습니다.

필요한 라이브러리 설치

Sentiment Analysis를 개발하기 위해, 다음과 같은 파이썬 라이브러리를 설치해야 합니다:

pip install tweepy
pip install textblob

tweepy: 트위터 API와 연동하기 위한 라이브러리입니다.
textblob: 텍스트 데이터의 Sentiment Analysis를 수행하는 라이브러리입니다.

트위터 API 연동

먼저, 트위터 API와 연동하기 위해 개발자 계정을 생성하고 API 키를 발급받아야 합니다. 발급받은 키를 사용하여 tweepy를 통해 트위터 데이터에 접근할 수 있습니다. 다음은 API 키를 사용하여 트위터 API와 연동하는 코드입니다:

import tweepy

consumer_key = 'YOUR_CONSUMER_KEY'
consumer_secret = 'YOUR_CONSUMER_SECRET'
access_token = 'YOUR_ACCESS_TOKEN'
access_token_secret = 'YOUR_ACCESS_TOKEN_SECRET'

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)

api = tweepy.API(auth)

위의 코드에서, YOUR_CONSUMER_KEY, YOUR_CONSUMER_SECRET, YOUR_ACCESS_TOKEN, YOUR_ACCESS_TOKEN_SECRET에는 발급받은 API 키를 사용합니다.

트위터 데이터 수집

트위터 API와 연동한 후, 특정 주제나 키워드에 대한 트위터 데이터를 수집합니다. tweepy를 사용하면 쉽게 트위터 데이터를 수집할 수 있습니다. 아래의 코드는 “#Apple” 키워드에 대한 트위터 데이터를 수집하는 예시입니다:

tweets = api.search(q="#Apple", count=100, lang="en")

q 매개변수에는 검색할 키워드를, count 매개변수에는 가져올 트윗의 수를 지정합니다. lang 매개변수는 트윗의 언어를 지정할 수 있습니다.

텍스트 데이터 처리 및 감정 분석

수집한 트위터 데이터를 텍스트 데이터로 변환한 후, textblob를 사용하여 Sentiment Analysis를 수행합니다. 아래의 코드는 트윗의 텍스트를 추출한 후, Sentiment Analysis를 수행하는 예시입니다:

from textblob import TextBlob

for tweet in tweets:
    text = tweet.text
    blob = TextBlob(text)
    sentiment = blob.sentiment.polarity
    print(f'Tweet: {text}')
    print(f'Sentiment: {sentiment}')
    print('---')

위의 코드에서, blob.sentiment.polarity는 각 트윗의 감정을 수치화한 값으로, -1부터 1 사이의 값을 가집니다. 값이 -1에 가까울수록 부정적인 감정, 1에 가까울수록 긍정적인 감정을 의미합니다.

결론

이번 포스트에서는 파이썬을 사용하여 트위터 Sentiment Analysis 알고리즘을 개발하는 방법을 살펴보았습니다. tweepy와 textblob를 사용하여 트위터 데이터를 수집하고, 텍스트 데이터를 처리하여 문장의 감정을 추출할 수 있습니다. 이를 활용하는 것으로 트위터 사용자의 감성을 파악하고, 의견을 분석할 수 있습니다.

#Tech #Python