[python] 파이썬 시각화를 통한 데이터 특성을 시각적으로 이해하기
데이터 시각화는 데이터를 이해하고 분석하는 데 중요한 도구입니다. 파이썬 언어는 다양한 시각화 도구를 제공하여 데이터를 시각적으로 컨트롤하고 이해할 수 있습니다.
Matplotlib를 사용한 기본적인 시각화
가장 기본적인 시각화 도구로는 Matplotlib이 있습니다. 다음은 간단한 선 그래프를 그리는 예제입니다.
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]
plt.plot(x, y)
plt.xlabel('X축')
plt.ylabel('Y축')
plt.title('간단한 선 그래프')
plt.show()
Seaborn을 사용한 고급 시각화
Seaborn은 Matplotlib을 기반으로 한 고급 시각화 도구입니다. 아래 예제는 히트맵을 생성하는 코드입니다.
import seaborn as sns
import pandas as pd
data = pd.DataFrame({
'A': [1, 2, 3, 4],
'B': [5, 6, 7, 8],
'C': [9, 10, 11, 12]
})
sns.heatmap(data, annot=True, cmap='YlGnBu')
plt.show()
데이터 분포 시각화
Histogram 및 Box plot은 데이터 분포를 이해하는 데 유용합니다. 아래 예제는 데이터의 분포를 보여주는 코드입니다.
import numpy as np
data = np.random.normal(0, 1, 1000) # 평균 0, 표준편차 1의 정규분포를 따르는 데이터 생성
plt.hist(data, bins=30)
plt.show()
결론
파이썬을 사용하여 다양한 시각화 도구를 활용하면 데이터 특성을 시각적으로 이해할 수 있습니다. Matplotlib을 활용하여 기본적인 시각화부터 Seaborn을 사용하여 고급 시각화까지 다양한 데이터 시각화 기술을 습득하면 데이터 분석 능력이 크게 향상될 것입니다.
참고문헌:
- https://matplotlib.org/
- https://seaborn.pydata.org/