[파이썬] bokeh 다양한 데이터 형식과의 호환성

Bokeh은 파이썬의 인터랙티브 시각화 라이브러리로서 데이터 시각화를 위한 강력한 기능을 제공합니다. Bokeh은 다양한 데이터 형식과의 호환성을 지원하여 , 데이터를 손쉽게 시각화할 수 있습니다. 이번 글에서는 Bokeh의 다양한 데이터 형식 지원 기능에 대해 알아보도록 하겠습니다.

1. Pandas 데이터프레임과의 호환성

Pandas는 데이터 분석과 조작을 위한 강력한 라이브러리입니다. Bokeh은 Pandas 데이터프레임을 사용하여 데이터를 시각화할 수 있도록 편리한 기능을 제공합니다. 다음은 Bokeh에서 Pandas 데이터프레임을 사용하는 예제 코드입니다:

from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource
import pandas as pd

# Pandas 데이터프레임 생성
data = {'x': [1, 2, 3, 4, 5], 'y': [5, 4, 3, 2, 1]}
df = pd.DataFrame(data)

# Bokeh의 ColumnDataSource로 데이터 소스 생성
source = ColumnDataSource(df)

# figure 생성
p = figure(title="Pandas 데이터프레임 예제", x_axis_label='x', y_axis_label='y')

# scatter plot 생성
p.circle(x='x', y='y', source=source)

# 그래프 표시
show(p)

위의 예제 코드에서는 Pandas 데이터프레임을 생성한 후, Bokeh의 ColumnDataSource로 데이터 소스를 만듭니다. 이후에는 생성한 데이터 소스를 바탕으로 scatter plot을 생성하여 그래프를 표시합니다.

2. NumPy 배열과의 호환성

NumPy는 파이썬의 수치 연산을 위한 핵심 라이브러리로, 다차원 배열을 다루는 기능을 제공합니다. Bokeh은 NumPy 배열과의 호환성을 지원하여, NumPy 배열을 사용하여 데이터를 시각화할 수 있습니다. 다음은 Bokeh에서 NumPy 배열을 사용하는 예제 코드입니다:

from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource
import numpy as np

# NumPy 배열 생성
x = np.linspace(0, 2*np.pi, 100)
y = np.sin(x)

# Bokeh의 ColumnDataSource로 데이터 소스 생성
source = ColumnDataSource(data={'x': x, 'y': y})

# figure 생성
p = figure(title="NumPy 배열 예제", x_axis_label='x', y_axis_label='y')

# line plot 생성
p.line(x='x', y='y', source=source)

# 그래프 표시
show(p)

위의 예제 코드에서는 NumPy 배열을 생성한 후, Bokeh의 ColumnDataSource로 데이터 소스를 만듭니다. 이후에는 생성한 데이터 소스를 바탕으로 line plot을 생성하여 그래프를 표시합니다.

3. CSV 파일과의 호환성

Bokeh은 CSV 파일을 사용하여 데이터를 시각화할 수 있도록 지원합니다. Bokeh의 pandas.read_csv() 함수를 사용하면 CSV 파일로부터 데이터를 읽어와서 시각화할 수 있습니다. 다음은 Bokeh에서 CSV 파일을 사용하는 예제 코드입니다:

from bokeh.plotting import figure, show
import pandas as pd

# CSV 파일 읽기
df = pd.read_csv('data.csv')

# figure 생성
p = figure(title="CSV 파일 예제", x_axis_label='x', y_axis_label='y')

# scatter plot 생성
p.circle(x='x', y='y', source=df)

# 그래프 표시
show(p)

위의 예제 코드에서는 data.csv라는 CSV 파일을 pandas.read_csv() 함수를 사용하여 읽어온 후, Bokeh의 figure 클래스를 사용하여 그래프를 생성합니다. 이후에는 scatter plot을 생성하여 그래프를 표시합니다.

Bokeh은 다양한 데이터 형식과의 호환성을 지원하여, 보다 편리하게 데이터를 시각화할 수 있도록 도와줍니다. Pandas 데이터프레임, NumPy 배열 및 CSV 파일과의 호환성을 이용하면 다양한 형태의 데이터를 손쉽게 시각화할 수 있습니다. Bokeh의 강력한 기능을 활용하여, 데이터의 특성을 더욱 명확하게 시각화해보세요.

이 글은 Bokeh의 공식 문서와 개인적인 경험을 기반으로 작성되었습니다.