Seaborn은 파이썬 데이터 시각화 라이브러리로서, Matplotlib을 기반으로 한 강력한 기능들을 제공합니다. Seaborn을 사용하면 훨씬 더 세련된 그래프를 만들 수 있으며, 다양한 데이터셋에 적용할 수 있는 다양한 예제를 살펴볼 것입니다. 다음 예제들은 Seaborn의 기능과 다양한 데이터셋을 활용하는 방법에 대해 살펴봅니다.
예제 1: Iris 데이터셋
Iris 데이터셋은 꽃의 품종을 분류하기 위해 사용되는 유명한 데이터셋입니다. Seaborn은 Iris 데이터셋을 내장하고 있어서 간단하게 불러와서 사용할 수 있습니다. 다음은 Iris 데이터셋을 바탕으로 꽃받침 길이와 꽃받침 너비 사이의 관계를 시각화하는 예제입니다:
import seaborn as sns
# Iris 데이터셋 불러오기
iris = sns.load_dataset("iris")
# scatterplot 그리기
sns.scatterplot(x="sepal_length", y="sepal_width", data=iris)
이를 실행하면, 꽃받침의 길이와 너비 사이의 관계를 나타내는 산점도가 그려집니다.
예제 2: Tips 데이터셋
Tips 데이터셋은 음식점에서의 팁에 대한 정보를 담고 있는 데이터셋입니다. 이 데이터셋을 활용하여 성별에 따른 팁의 분포를 시각화해보겠습니다. 다음은 Tips 데이터셋을 활용하여 성별에 따른 팁의 분포를 박스플롯으로 나타내는 예제입니다:
import seaborn as sns
# Tips 데이터셋 불러오기
tips = sns.load_dataset("tips")
# 박스플롯 그리기
sns.boxplot(x="sex", y="tip", data=tips)
위 코드를 실행하면, 남성과 여성의 팁 분포를 비교하는 박스플롯이 그려집니다.
예제 3: Titanic 데이터셋
Titanic 데이터셋은 유명한 생존 분석 데이터셋으로서, 타이타닉호 승객들의 정보와 생존 여부를 담고 있습니다. 이 데이터셋을 활용하여 성별에 따른 생존율을 시각화해보겠습니다. 다음은 Titanic 데이터셋을 활용하여 성별에 따른 생존율을 막대그래프로 나타내는 예제입니다:
import seaborn as sns
# Titanic 데이터셋 불러오기
titanic = sns.load_dataset("titanic")
# 막대그래프 그리기
sns.barplot(x="sex", y="survived", data=titanic)
위 코드를 실행하면, 남성과 여성의 생존율을 비교하는 막대그래프가 그려집니다.
Seaborn은 이 외에도 다양한 데이터셋과 시각화 기능들을 제공하며, 더욱 복잡한 분석과 시각화 작업에 활용할 수 있습니다. Seaborn의 다양한 기능과 데이터셋을 참고하여 데이터 시각화에 효과적으로 활용해보세요.