[python] 주피터 노트북에서 데이터 시각화 툴 활용하기

주피터 노트북은 데이터 분석 및 시각화 작업을 수행하는 데 가장 일반적으로 사용되는 툴 중 하나입니다. 여기에는 다양한 데이터 시각화 라이브러리와 도구들이 포함되어 있으며, 이를 통해 데이터를 시각적으로 탐색하고 해석할 수 있습니다.

Matplotlib를 사용한 기본적인 데이터 시각화

가장 기본적인 데이터 시각화 라이브러리 중 하나인 Matplotlib를 사용하여 주피터 노트북에서 데이터를 시각화할 수 있습니다. 다음은 간단한 선 그래프를 그리는 예제 코드입니다.

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

plt.plot(x, y)
plt.xlabel('X-axis label')
plt.ylabel('Y-axis label')
plt.title('Simple Line Plot')
plt.show()

Seaborn을 사용한 고급 데이터 시각화

Seaborn은 Matplotlib을 기반으로 만들어진 데이터 시각화 라이브러리로, 통계 데이터 시각화에 특화되어 있습니다. 주피터 노트북에서 Seaborn을 사용하여 다양한 종류의 그래프를 그릴 수 있습니다.

import seaborn as sns
import pandas as pd

# 예제 데이터 생성
data = pd.DataFrame({
    'x': [1, 2, 3, 4, 5],
    'y': [2, 3, 5, 7, 11]
})

# 산점도 그래프 그리기
sns.scatterplot(x='x', y='y', data=data)

Plotly를 사용한 인터랙티브 데이터 시각화

Plotly는 인터랙티브한 데이터 시각화를 제공하는 라이브러리로, 주피터 노트북에서도 쉽게 활용할 수 있습니다. 아래는 Plotly를 사용하여 간단한 막대 그래프를 그리는 예제 코드입니다.

import plotly.express as px
import pandas as pd

# 예제 데이터 생성
data = pd.DataFrame({
    'category': ['A', 'B', 'C', 'D'],
    'value': [3, 7, 2, 5]
})

# 막대 그래프 그리기
fig = px.bar(data, x='category', y='value')
fig.show()

결론

주피터 노트북은 Matplotlib, Seaborn, Plotly 등 다양한 데이터 시각화 라이브러리와 툴을 지원하여 데이터 분석가들이 데이터를 보다 효과적으로 시각화하고 해석할 수 있도록 도와줍니다. 이러한 시각화 도구들을 활용하여 데이터 시각화 작업을 보다 효율적으로 수행할 수 있습니다.

참고 자료