Seaborn의 데이터 분포 시각화 기능 알아보기
Seaborn은 Python의 데이터 시각화 라이브러리로, Matplotlib을 기반으로한 더 간편하고 직관적인 인터페이스를 제공합니다. 이번 블로그 포스트에서는 Seaborn을 사용하여 데이터 분포를 시각화하는 기능에 대해 알아보겠습니다.
히스토그램
히스토그램은 데이터의 분포를 막대형태로 표현하는 차트입니다. Seaborn의 distplot
함수를 사용하여 간단하게 히스토그램을 생성할 수 있습니다.
import seaborn as sns
import matplotlib.pyplot as plt
# 데이터 생성
data = [78, 85, 92, 68, 75, 80, 83, 87, 90, 79, 84, 88, 74, 82, 86, 81]
# 히스토그램 생성
sns.distplot(data)
# 차트 출력
plt.show()
박스 플롯
박스 플롯은 데이터의 분포를 위, 아래의 수치로 표현하는 차트입니다. Seaborn의 boxplot
함수를 사용하여 박스 플롯을 생성할 수 있습니다.
import seaborn as sns
import matplotlib.pyplot as plt
# 데이터 생성
data1 = [78, 85, 92, 68, 75, 80]
data2 = [83, 87, 90, 79, 84, 88]
# 박스 플롯 생성
sns.boxplot(data=[data1, data2])
# 차트 출력
plt.show()
산점도
산점도는 두 변수간의 상관관계를 나타내는 차트입니다. Seaborn의 scatterplot
함수를 사용하여 산점도를 생성할 수 있습니다.
import seaborn as sns
import matplotlib.pyplot as plt
# 데이터 생성
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y = [3, 5, 7, 9, 11, 13, 15, 17, 19, 21]
# 산점도 생성
sns.scatterplot(x=x, y=y)
# 차트 출력
plt.show()
Seaborn은 데이터 분포를 직관적으로 시각화할 수 있는 다양한 기능을 제공합니다. 이 외에도 히트맵, 바이올린 플롯, 커널 밀도 추정 등 다양한 차트를 생성할 수 있습니다. Seaborn 공식 문서를 참조하면 더 많은 기능을 알아볼 수 있습니다.
참고자료
- Seaborn 공식 문서: https://seaborn.pydata.org/
- Seaborn API 문서: https://seaborn.pydata.org/api.html
#데이터시각화 #Seaborn