Seaborn을 사용하여 범주형 데이터 플롯 그리기

개요

Seaborn은 파이썬의 시각화 라이브러리 중 하나로, 통계적 그래픽스를 위한 높은 수준의 인터페이스를 제공합니다. 이를 사용하여 다양한 종류의 범주형 데이터 플롯을 그릴 수 있습니다. 이 글에서는 Seaborn을 사용하여 범주형 데이터를 시각화하는 방법에 대해 알아보겠습니다.

Bar Plot

Bar plot은 범주형 데이터의 빈도수나 평균값을 막대 형태로 나타내는 가장 간단한 그래프입니다. Seaborn의 barplot 함수를 사용하여 그릴 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 범주형 데이터 생성
categories = ['A', 'B', 'C', 'D', 'E']
values = [10, 25, 15, 30, 20]

# Bar plot 그리기
sns.barplot(x=categories, y=values)

plt.show()

위의 코드는 categoriesvalues라는 두 개의 리스트를 만들고, 이를 xy축으로 지정하여 bar plot을 그리는 예시입니다.

Count Plot

Count plot은 각 범주별로 데이터의 개수를 막대로 나타내는 그래프입니다. Seaborn의 countplot 함수를 사용하여 그릴 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 범주형 데이터 생성
categories = ['A', 'A', 'B', 'C', 'C', 'C', 'D', 'E', 'E', 'E']

# Count plot 그리기
sns.countplot(x=categories)

plt.show()

위의 코드는 categories라는 하나의 리스트를 만들고, 이를 x축으로 지정하여 count plot을 그리는 예시입니다.

Categorical Scatter Plot

Categorical scatter plot은 범주형 데이터를 산점도 형태로 나타내는 그래프로, Seaborn의 stripplot 함수를 사용하여 그릴 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 범주형 데이터 생성
categories = ['A', 'B', 'B', 'C', 'C', 'C', 'D', 'E', 'E', 'E']
values = [5, 10, 15, 20, 25, 30, 35, 40, 45, 50]

# Categorical scatter plot 그리기
sns.stripplot(x=categories, y=values)

plt.show()

위의 코드는 categoriesvalues라는 두 개의 리스트를 만들고, 이를 xy축으로 지정하여 categorical scatter plot을 그리는 예시입니다.

결론

이렇듯 Seaborn을 사용하면 간단하게 범주형 데이터를 시각화할 수 있습니다. Bar plot, count plot, categorical scatter plot 외에도 다양한 종류의 범주형 데이터 플롯을 그릴 수 있으니, 필요에 따라 다양한 함수를 활용하여 데이터를 시각화해보세요.

#seaborn #데이터시각화