Seaborn의 데이터 분포 시각화 기능 알아보기

Seaborn은 Python의 데이터 시각화 라이브러리로, Matplotlib을 기반으로한 더 간편하고 직관적인 인터페이스를 제공합니다. 이번 블로그 포스트에서는 Seaborn을 사용하여 데이터 분포를 시각화하는 기능에 대해 알아보겠습니다.

히스토그램

히스토그램은 데이터의 분포를 막대형태로 표현하는 차트입니다. Seaborn의 distplot 함수를 사용하여 간단하게 히스토그램을 생성할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 생성
data = [78, 85, 92, 68, 75, 80, 83, 87, 90, 79, 84, 88, 74, 82, 86, 81]

# 히스토그램 생성
sns.distplot(data)

# 차트 출력
plt.show()

박스 플롯

박스 플롯은 데이터의 분포를 위, 아래의 수치로 표현하는 차트입니다. Seaborn의 boxplot 함수를 사용하여 박스 플롯을 생성할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 생성
data1 = [78, 85, 92, 68, 75, 80]
data2 = [83, 87, 90, 79, 84, 88]

# 박스 플롯 생성
sns.boxplot(data=[data1, data2])

# 차트 출력
plt.show()

산점도

산점도는 두 변수간의 상관관계를 나타내는 차트입니다. Seaborn의 scatterplot 함수를 사용하여 산점도를 생성할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 생성
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y = [3, 5, 7, 9, 11, 13, 15, 17, 19, 21]

# 산점도 생성
sns.scatterplot(x=x, y=y)

# 차트 출력
plt.show()

Seaborn은 데이터 분포를 직관적으로 시각화할 수 있는 다양한 기능을 제공합니다. 이 외에도 히트맵, 바이올린 플롯, 커널 밀도 추정 등 다양한 차트를 생성할 수 있습니다. Seaborn 공식 문서를 참조하면 더 많은 기능을 알아볼 수 있습니다.

참고자료

#데이터시각화 #Seaborn