[파이썬] bokeh 시계열 데이터 시각화
시계열 데이터 시각화는 데이터의 패턴, 트렌드, 주기성 등을 시각적으로 파악할 수 있어 매우 중요합니다. Bokeh는 파이썬 기반의 시각화 라이브러리로, 시각화 과정을 간단하고 효과적으로 만들어줍니다. 이번 블로그 포스트에서는 Bokeh를 사용하여 시계열 데이터를 어떻게 시각화할 수 있는지 알아보겠습니다.
Bokeh란?
Bokeh는 인터랙티브한 시각화를 제공하는 파이썬 라이브러리입니다. Bokeh를 사용하면 웹 기반의 대화형 시각화를 쉽게 만들 수 있으며, 그래프를 확대/축소하거나 마우스로 데이터를 선택/필터링하는 등의 상호작용이 가능합니다. 또한, Bokeh는 여러 종류의 그래프와 플롯을 제공하여 다양한 시각화 요구에 부합할 수 있습니다.
Bokeh로 시계열 데이터 시각화하기
Bokeh를 사용하여 시계열 데이터를 시각화하기 위해서는 몇 가지 단계를 거쳐야 합니다.
- 필요한 라이브러리 가져오기:
import pandas as pd from bokeh.plotting import figure, show from bokeh.io import output_notebook
- 데이터 불러오기:
시계열 데이터를 불러올 때에는 주로
pandas
라이브러리를 사용합니다. 예를 들어, CSV 파일로 저장된 데이터를 불러오는 경우:data = pd.read_csv('data.csv')
- 그래프 생성하기:
# Bokeh 출력을 Jupyter 노트북 내에서 보기 위한 준비 output_notebook() # Figure 객체 생성 p = figure(title='시계열 데이터', x_axis_type='datetime') # 데이터 포인트 추가 p.line(data['날짜'], data['값'])
- 그래프 출력하기:
show(p)
Bokeh로 시계열 데이터 시각화 예제
아래는 Bokeh를 사용하여 시계열 데이터를 시각화하는 예제 코드입니다.
import pandas as pd
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
# Bokeh 출력을 Jupyter 노트북 내에서 보기 위한 준비
output_notebook()
# 데이터 불러오기
data = pd.read_csv('data.csv')
# Figure 객체 생성
p = figure(title='시계열 데이터', x_axis_type='datetime')
# 데이터 포인트 추가
p.line(data['날짜'], data['값'])
# 그래프 출력
show(p)
위 예제에서 data.csv
는 시계열 데이터가 저장된 CSV 파일입니다. 날짜
열은 날짜/시간 정보를 담고 있으며, 값
열은 해당 날짜의 값입니다. 그래프 생성을 위해 line
메소드가 사용되었으며, x축의 데이터 타입을 datetime
으로 지정했습니다.
이제 Bokeh를 사용하여 다양한 시계열 데이터를 시각화해 볼 수 있습니다. Bokeh를 활용하면 복잡한 시계열 분석과 시각화 작업을 더욱 쉽고 효과적으로 수행할 수 있습니다.