Seaborn은 파이썬의 데이터 시각화 라이브러리 중 하나로, Matplotlib를 기반으로 한 보다 간단하고 효과적인 시각화 툴입니다. Seaborn은 데이터 시각화를 위한 고급 기능을 제공하며, 사용자 친화적인 API를 통해 더 간편하게 시각화를 할 수 있습니다.
이번 글에서는 Seaborn의 기본 기능과 사용법을 배워보겠습니다.
목차
- Seaborn 설치하기
- 데이터셋 불러오기
- 단변량 데이터 시각화
- 이변량 데이터 시각화
- 다변량 데이터 시각화
- 통계적 그래프 표현하기
- 추가적인 기능 및 스타일링
1. Seaborn 설치하기
Seaborn을 사용하기 위해서는 먼저 해당 라이브러리를 설치해야 합니다. 아래의 명령어를 이용하여 설치할 수 있습니다:
pip install seaborn
2. 데이터셋 불러오기
Seaborn은 기본적으로 내부 데이터셋을 제공하여 실습할 수 있도록 합니다. 데이터셋을 불러오기 위해서는 seaborn.load_dataset()
함수를 사용합니다. 예를 들어, “titanic” 데이터셋을 불러오기 위해서는 아래와 같이 입력합니다:
import seaborn as sns
df = sns.load_dataset("titanic")
3. 단변량 데이터 시각화
Seaborn은 단변량 데이터의 분포를 알아보기 위한 다양한 그래프를 제공합니다. 예를 들어, 히스토그램을 그리기 위해서는 sns.histplot()
함수를 사용합니다:
sns.histplot(data=df, x="age")
4. 이변량 데이터 시각화
이변량 데이터의 관계를 시각화하기 위해서 Seaborn은 산점도, 관계 그래프, 히트맵 등 다양한 그래프를 제공합니다.
sns.scatterplot(data=df, x="age", y="fare")
5. 다변량 데이터 시각화
Seaborn은 다변량 데이터를 시각화하기 위한 여러 가지 방법을 제공합니다. 예를 들어, 다변량 그래프를 그리기 위해서는 sns.pairplot()
함수를 사용합니다:
sns.pairplot(data=df, vars=["age", "fare", "survived"], hue="sex")
6. 통계적 그래프 표현하기
Seaborn은 통계적 그래프를 통해 데이터의 상관관계를 쉽게 파악할 수 있도록 도와줍니다. 예를 들어, sns.lineplot()
함수를 통해 선그래프를 그릴 수 있습니다:
sns.lineplot(data=df, x="age", y="fare", hue="survived")
7. 추가적인 기능 및 스타일링
Seaborn은 그래프의 스타일링을 위한 다양한 옵션을 제공합니다. 예를 들어, sns.set_style()
함수를 통해 그래프의 스타일을 설정할 수 있습니다:
sns.set_style("ticks")
위의 예시는 그래프의 배경에 작은 눈금을 추가하는 스타일입니다.
이 외에도 Seaborn은 다양한 기능과 그래프 유형을 제공하므로, 공식 문서를 참고하여 더 자세한 사용법을 익히시기 바랍니다.