[python] Bokeh를 활용한 미디어 소비 데이터 시각화

소개

이번 글에서는 Python의 데이터 시각화 라이브러리인 Bokeh를 사용하여 미디어 소비 데이터를 시각화하는 방법을 알아보겠습니다. Bokeh는 인터랙티브한 시각화를 생성하는 것에 특화되어 있어, 사용자들이 미디어 소비 동향을 탐색하고 분석하는데 유용합니다.

필요한 패키지 설치

먼저, Bokeh를 사용하기 위해 아래 명령어를 통해 필요한 패키지를 설치합니다.

pip install bokeh

데이터 불러오기

이번 예제에서는 CSV 파일 형태로 미디어 소비 데이터를 사용하겠습니다. 먼저, 데이터를 불러오기 위해 pandas 패키지를 사용합니다. 아래 코드를 사용하여 데이터를 불러오세요.

import pandas as pd

data = pd.read_csv('media_consumption_data.csv')

데이터 전처리

데이터를 불러온 후에는 필요한 전처리를 수행해야 합니다. 예를 들어, 날짜와 시간 형식을 맞추거나 필요한 열을 추출할 수 있습니다. 이 예제에서는 데이터에서 날짜소비시간 열을 사용합니다.

data['날짜'] = pd.to_datetime(data['날짜'])
data['소비시간'] = pd.to_datetime(data['소비시간'], format='%H:%M:%S').dt.time

시각화하기

이제 Bokeh를 사용하여 데이터를 시각화해보겠습니다. 아래 코드는 간단한 선 그래프 예제입니다.

from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource

# 데이터를 ColumnDataSource 형태로 변경
source = ColumnDataSource(data)

p = figure(x_axis_type='datetime', height=300, width=600)
p.line(x='날짜', y='소비시간', source=source, line_width=2, line_color="blue")
p.xaxis.axis_label = "날짜"
p.yaxis.axis_label = "소비시간"

show(p)

결과 확인

위 코드를 실행하면 Bokeh가 제공하는 인터랙티브한 시각화가 나타납니다. 이를 통해 미디어 소비 데이터의 패턴이나 트렌드를 쉽게 파악할 수 있습니다.

결론

Bokeh를 사용하면 빠르고 직관적인 미디어 소비 데이터 시각화를 할 수 있습니다. Bokeh의 다양한 기능을 활용하여 더 다양하고 복잡한 시각화도 구현할 수 있으니, 관심 있는 분야에서 활용해보세요.

참고 자료