Seaborn으로 산점도 그리기

개요

Seaborn은 파이썬 데이터 시각화 라이브러리 중 하나로, Matplotlib을 기반으로 만들어진 고급화된 그래프를 그리기 위해 사용됩니다. 이번 포스트에서는 Seaborn을 사용하여 산점도를 그리는 방법에 대해 알아보겠습니다.

산점도(Scatter plot)

산점도는 두 개의 변수 간의 관계를 시각화하는데 사용되는 그래프입니다. X축과 Y축에 대응되는 변수들의 값을 표시하고, 각 변수들 간의 관계를 확인할 수 있습니다.

Seaborn으로 산점도 그리기

Seaborn 라이브러리를 사용하여 산점도를 그리려면 다음의 단계를 따라야 합니다:

  1. Seaborn 라이브러리를 import 합니다.
     import seaborn as sns
    
  2. 산점도를 그릴 데이터를 준비합니다. 예를 들어, 두 개의 변수(Y, X)로 이루어진 데이터프레임 “df”가 있다고 가정해봅시다.

  3. sns.scatterplot() 함수를 사용하여 산점도를 그립니다. 이 함수는 x, y, data 파라미터를 받아들입니다. x는 X축에 해당하는 변수를, y는 Y축에 해당하는 변수를 지정하고, data는 사용할 데이터프레임을 지정합니다.

    sns.scatterplot(x="X", y="Y", data=df)
    
  4. 그래프에 추가적인 스타일링이나 플롯 설정을 적용할 수 있습니다. Seaborn 라이브러리의 다양한 함수와 인자들을 사용하여 그래프를 원하는대로 꾸밀 수 있습니다.

    sns.scatterplot(x="X", y="Y", data=df, marker='s', color='g')
    sns.set_style("whitegrid")
    sns.despine()
    # 더 많은 스타일 및 설정을 적용할 수 있습니다.
    

예제 코드

import seaborn as sns

# 예제 데이터프레임 생성
data = {'X': [1, 2, 3, 4, 5],
        'Y': [2, 4, 6, 8, 10]}
df = pd.DataFrame(data)

# 산점도 그리기
sns.scatterplot(x="X", y="Y", data=df)

# 스타일링 및 플롯 설정
sns.scatterplot(x="X", y="Y", data=df, marker='s', color='g')
sns.set_style("whitegrid")
sns.despine()

결론

Seaborn은 간편한 문법과 다양한 스타일링 옵션을 제공하여 산점도를 그리는 과정을 간편하게 만들어 줍니다. 데이터 시각화를 통해 변수들 간의 관계를 시각적으로 이해하는데 도움이 되는 Seaborn을 활용해 보세요.

References