Seaborn 입문 및 기본 기능 배우기

Seaborn은 파이썬의 데이터 시각화 라이브러리 중 하나로, Matplotlib를 기반으로 한 보다 간단하고 효과적인 시각화 툴입니다. Seaborn은 데이터 시각화를 위한 고급 기능을 제공하며, 사용자 친화적인 API를 통해 더 간편하게 시각화를 할 수 있습니다.

이번 글에서는 Seaborn의 기본 기능과 사용법을 배워보겠습니다.

목차

  1. Seaborn 설치하기
  2. 데이터셋 불러오기
  3. 단변량 데이터 시각화
  4. 이변량 데이터 시각화
  5. 다변량 데이터 시각화
  6. 통계적 그래프 표현하기
  7. 추가적인 기능 및 스타일링

1. Seaborn 설치하기

Seaborn을 사용하기 위해서는 먼저 해당 라이브러리를 설치해야 합니다. 아래의 명령어를 이용하여 설치할 수 있습니다:

pip install seaborn

2. 데이터셋 불러오기

Seaborn은 기본적으로 내부 데이터셋을 제공하여 실습할 수 있도록 합니다. 데이터셋을 불러오기 위해서는 seaborn.load_dataset() 함수를 사용합니다. 예를 들어, “titanic” 데이터셋을 불러오기 위해서는 아래와 같이 입력합니다:

import seaborn as sns

df = sns.load_dataset("titanic")

3. 단변량 데이터 시각화

Seaborn은 단변량 데이터의 분포를 알아보기 위한 다양한 그래프를 제공합니다. 예를 들어, 히스토그램을 그리기 위해서는 sns.histplot() 함수를 사용합니다:

sns.histplot(data=df, x="age")

4. 이변량 데이터 시각화

이변량 데이터의 관계를 시각화하기 위해서 Seaborn은 산점도, 관계 그래프, 히트맵 등 다양한 그래프를 제공합니다.

sns.scatterplot(data=df, x="age", y="fare")

5. 다변량 데이터 시각화

Seaborn은 다변량 데이터를 시각화하기 위한 여러 가지 방법을 제공합니다. 예를 들어, 다변량 그래프를 그리기 위해서는 sns.pairplot() 함수를 사용합니다:

sns.pairplot(data=df, vars=["age", "fare", "survived"], hue="sex")

6. 통계적 그래프 표현하기

Seaborn은 통계적 그래프를 통해 데이터의 상관관계를 쉽게 파악할 수 있도록 도와줍니다. 예를 들어, sns.lineplot() 함수를 통해 선그래프를 그릴 수 있습니다:

sns.lineplot(data=df, x="age", y="fare", hue="survived")

7. 추가적인 기능 및 스타일링

Seaborn은 그래프의 스타일링을 위한 다양한 옵션을 제공합니다. 예를 들어, sns.set_style() 함수를 통해 그래프의 스타일을 설정할 수 있습니다:

sns.set_style("ticks")

위의 예시는 그래프의 배경에 작은 눈금을 추가하는 스타일입니다.

이 외에도 Seaborn은 다양한 기능과 그래프 유형을 제공하므로, 공식 문서를 참고하여 더 자세한 사용법을 익히시기 바랍니다.

References