[python] Bokeh를 사용하여 영화 박스오피스 시각화하기

Bokeh는 파이썬 기반의 시각화 도구로써, 데이터를 interative하게 시각화할 수 있는 강력한 라이브러리입니다. 이번 예제에서는 Bokeh를 사용하여 영화 박스오피스 데이터를 시각화하는 방법에 대해 알아보겠습니다.

필요한 패키지 설치하기

먼저, Bokeh를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install bokeh

또한, 박스오피스 데이터를 가져오기 위해 pandas 패키지도 필요합니다. 아래의 명령어로 설치해주세요.

pip install pandas

데이터 가져오기

영화 박스오피스 데이터는 일반적으로 CSV 파일 형식으로 제공됩니다. 이번 예제에서는 boxoffice.csv라는 이름의 파일을 사용하겠습니다.

import pandas as pd

# 데이터 파일 경로
data_path = 'boxoffice.csv'

# 데이터 프레임으로 변환
df = pd.read_csv(data_path)

시각화하기

Bokeh를 사용하여 영화 박스오피스 데이터를 시각화하기 위해서는 다음과 같은 단계를 따릅니다.

  1. Bokeh 모듈 및 도구 임포트
  2. 데이터 프레임 변환
  3. 그래프 객체 생성
  4. 필요한 설정 (제목, 축 라벨, 범례 등)
  5. 데이터를 그래프에 추가
  6. 그래프 출력

예를 들어, 전체 박스오피스 순위를 막대 그래프로 시각화할 수 있습니다.

from bokeh.io import output_file, show
from bokeh.plotting import figure

# 결과를 저장할 HTML 파일 경로
output_file("boxoffice_rank.html")

# 그래프 객체 생성
p = figure(x_range=df['영화'], plot_height=400, plot_width=800, title='Box Office Rank')

# x축 라벨 설정
p.xaxis.axis_label = '영화'
p.xaxis.major_label_orientation = 45

# y축 라벨 설정
p.yaxis.axis_label = '순위'

# 막대 그래프 추가
p.vbar(x=df['영화'], top=df['순위'], width=0.9, fill_color='orange')

# 그래프 출력
show(p)

결과 확인하기

위의 코드를 실행하면 boxoffice_rank.html 파일이 생성될 것입니다. 이 파일을 웹 브라우저로 열어 그래프 결과를 확인할 수 있습니다.

결론

Bokeh를 사용하여 영화 박스오피스 데이터를 시각화하는 방법에 대해 알아보았습니다. Bokeh는 다양한 시각화 옵션과 인터랙티브한 기능을 제공하여 데이터 탐색과 분석을 보다 쉽고 흥미로운 경험으로 만들어줍니다. 여러분도 Bokeh를 사용하여 데이터를 직관적으로 시각화해보세요!