[python] Bokeh를 사용하여 수원공관 상영작 분석 시각화하기

수원공관은 한국에서 가장 오래된 극장 중 하나로, 다양한 영화 상영작을 제공하고 있습니다. 이번에는 Python의 Bokeh 라이브러리를 사용하여 수원공관에서 상영한 영화들의 분석 결과를 시각화해보려고 합니다.

목표

수원공관의 상영작 데이터를 분석하여 다음과 같은 정보를 시각화합니다:

데이터 수집

먼저, 수원공관의 상영작 데이터를 수집해야 합니다. 이를 위해 웹 크롤링을 사용하거나, 수동으로 데이터를 입력할 수도 있습니다.

예를 들어 아래와 같이 상영작 정보를 담은 CSV 파일을 사용할 수 있습니다.

title,genre,date
Movie A,Action,2021-01-01
Movie B,Comedy,2021-01-02
Movie C,Action,2021-01-03
...

Bokeh 라이브러리 설치

Bokeh를 사용하기 위해 먼저 라이브러리를 설치해야 합니다. 다음 명령어를 사용하여 설치할 수 있습니다:

pip install bokeh

코드 구현

다음은 Bokeh를 사용하여 수원공관의 상영작 데이터를 시각화하는 코드 예시입니다.

import pandas as pd
from bokeh.plotting import figure, show
from bokeh.io import output_notebook

# 데이터 읽기
data = pd.read_csv('movies.csv')

# 장르별 상영 횟수
genre_counts = data['genre'].value_counts()

# 월별 상영작 수
data['date'] = pd.to_datetime(data['date'])
data['month'] = data['date'].dt.month
month_counts = data['month'].value_counts().sort_index()

# 연도별 상영작 수
data['year'] = data['date'].dt.year
year_counts = data['year'].value_counts().sort_index()

# 시각화
output_notebook()
p = figure(x_range=genre_counts.index.tolist(), title='장르별 상영 횟수')
p.vbar(x=genre_counts.index.tolist(), top=genre_counts.tolist(), width=0.5)
show(p)

p = figure(x_range=month_counts.index.tolist(), title='월별 상영작 수')
p.line(month_counts.index.tolist(), month_counts.tolist())
show(p)

p = figure(x_range=year_counts.index.tolist(), title='연도별 상영작 수')
p.line(year_counts.index.tolist(), year_counts.tolist())
show(p)

결과

위의 코드를 실행하면 Bokeh를 통해 장르별 상영 횟수, 월별 상영작 수, 연도별 상영작 수를 시각화한 그래프가 출력됩니다.

참고 자료