[python] Bokeh를 사용하여 도서 판매 데이터 시각화하기

Bokeh는 파이썬 기반의 데이터 시각화 라이브러리로, 인터랙티브한 시각화를 쉽게 구현할 수 있습니다. 이번에는 Bokeh를 사용하여 도서 판매 데이터를 시각화하는 방법을 알아보겠습니다.

데이터 준비

먼저, 도서 판매 데이터를 준비해야 합니다. 예를 들어, sales.csv라는 CSV 파일이 있다고 가정해보겠습니다. 이 파일에는 도서 제목, 저자, 출판사, 판매량 등의 정보가 포함되어 있어야 합니다.

Bokeh 설치

Bokeh를 사용하기 위해 먼저 Bokeh 패키지를 설치해야 합니다. 아래 명령어를 사용하여 설치할 수 있습니다.

pip install bokeh

코드 작성

이제 Bokeh를 사용하여 도서 판매 데이터를 시각화하는 코드를 작성해보겠습니다. 아래는 예시 코드입니다.

import pandas as pd
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import HoverTool

# 데이터 불러오기
df = pd.read_csv('sales.csv')

# 그래프 설정
output_notebook()
TOOLTIPS = [
    ("Title", "@title"),
    ("Author", "@author"),
    ("Publisher", "@publisher"),
    ("Sales", "@sales")
]
p = figure(x_range=df['title'], plot_height=500, plot_width=800, title="Book Sales",
           toolbar_location=None, tooltips=TOOLTIPS)
p.vbar(x='title', top='sales', width=0.9, source=df)

# 그래프 출력
show(p)

위 코드에서는 pandas를 사용하여 데이터를 불러온 후, Bokeh의 figure 클래스를 사용하여 그래프를 설정합니다. 그리고 vbar 메서드를 사용하여 막대 그래프를 생성합니다. 마지막으로 show 함수를 호출하여 그래프를 출력합니다.

실행

위 코드를 작성한 후, 해당 파일을 실행하면 Bokeh 서버가 시작되고 그래프가 브라우저에서 동적으로 출력됩니다. 그래프를 마우스로 이동하면 각 도서에 대한 정보를 확인할 수 있습니다.

결론

이렇게 Bokeh를 사용하여 도서 판매 데이터를 시각화할 수 있습니다. Bokeh의 다양한 기능과 설정 옵션을 사용하여 보다 자세하고 멋진 시각화를 구현할 수 있으니, Bokeh 공식 문서나 예제 코드를 참고하여 다양한 시각화를 시도해보세요.

참고 자료