[파이썬] seaborn 두 변수 간의 관계 표현하기

Seaborn은 데이터 시각화를 위한 Python 라이브러리로, 두 변수 간의 관계를 표현할 때 매우 유용합니다. 이번 글에서는 Seaborn을 사용하여 두 변수 간의 관계를 시각화하는 방법에 대해 알아보겠습니다.

라이브러리 설치

먼저 Seaborn을 설치해야 합니다. 아래의 명령어를 사용하여 Seaborn을 설치할 수 있습니다:

pip install seaborn

두 변수 간의 관계 표현하기

Seaborn은 다양한 방법으로 두 변수 간의 관계를 시각화할 수 있습니다. 예를 들어, scatter plot, line plot, bar plot 등을 사용할 수 있습니다. 이번 예제에서는 가장 기본적인 scatter plot을 사용하여 두 변수 간의 관계를 표현해보겠습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 생성
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 데이터 프레임 생성
data = {'x': x, 'y': y}
df = pd.DataFrame(data)

# scatter plot 그리기
sns.scatterplot(data=df, x='x', y='y')

# 그래프 타이틀 설정
plt.title('Scatter Plot of x and y')

# 그래프 보이기
plt.show()

위의 코드를 실행하면 x와 y 변수 사이의 관계를 scatter plot으로 시각화할 수 있습니다. scatter plot은 x와 y의 값을 가지고 점을 찍어 표현하는 그래프입니다.

추가적인 설정

Seaborn을 사용하여 두 변수 간의 관계를 표현할 때, 다양한 설정을 추가할 수 있습니다. 예를 들어, 점의 색상, 크기, 선의 스타일 등을 조정할 수 있습니다. 또한, 다른 종류의 plot을 사용하여 두 변수 간의 관계를 표현할 수도 있습니다.

# scatter plot 설정
sns.scatterplot(data=df, x='x', y='y', color='red', marker='s', s=100)

# 점의 색상: 빨간색
# 점의 모양: 사각형
# 점의 크기: 100

# line plot 설정
sns.lineplot(data=df, x='x', y='y', color='blue', linewidth=2)

# 선의 색상: 파란색
# 선의 두께: 2

# bar plot 설정
sns.barplot(data=df, x='x', y='y', color='green')

# 막대의 색상: 초록색

위의 코드는 scatter plot, line plot, bar plot을 설정하는 예제입니다. 각각의 plot은 점, 선, 막대로 두 변수 간의 관계를 표현합니다. 설정에 따라 원하는 시각화 결과를 얻을 수 있습니다.

결론

Seaborn은 두 변수 간의 관계를 효과적으로 시각화하기 위한 도구로 매우 유용합니다. scatter plot, line plot, bar plot을 사용하여 다양한 형태로 두 변수 간의 관계를 표현할 수 있습니다. Seaborn을 사용하여 데이터를 시각화함으로써 다양한 패턴이나 트렌드를 발견하고, 데이터 분석에 도움을 줄 수 있습니다.