[파이썬] seaborn 데이터 특성 간의 상호작용 시각화

데이터 분석을 위해 Seaborn을 사용하는 경우, 데이터의 특성 간에 어떤 상호작용이 있는지 시각화하는 것은 중요한 단계입니다. 이를 통해 데이터의 패턴과 관계를 파악할 수 있으며, 모델링이나 예측에 도움이 됩니다. 이번 포스트에서는 Seaborn을 사용하여 데이터의 특성 간 상호작용을 시각화하는 방법을 살펴보겠습니다.

그리드 플롯

Seaborn에서 그리드 플롯은 두 개 이상의 변수 간의 관계를 시각화하기 위해 사용됩니다. 여러 변수 간의 조합을 그리드 형태로 배열하여 각 셀에 플롯을 그립니다. 이를 통해 다차원 데이터의 다양한 상호작용을 살펴볼 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 불러오기
data = sns.load_dataset('iris')

# 그리드 플롯 그리기
sns.pairplot(data, hue='species')

# 그래프 표시
plt.show()

위의 코드는 Seaborn에서 제공하는 ‘iris’ 데이터셋을 불러온 후, pairplot 함수를 사용하여 그리드 플롯을 그리는 예제입니다. hue 매개변수를 통해 레이블 변수를 지정하여 서로 다른 색상으로 구분할 수 있습니다.

히트맵

히트맵은 데이터셋의 특성 간 상관관계를 시각화하는 데 사용됩니다. 피어슨 상관계수를 기반으로 각 특성들이 얼마나 관계가 있는지를 색상으로 나타냅니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 불러오기
data = sns.load_dataset('flights')
data = data.pivot('month', 'year', 'passengers')

# 히트맵 그리기
sns.heatmap(data, annot=True, cmap='YlGnBu')

# 그래프 표시
plt.show()

위의 코드는 Seaborn에서 제공하는 ‘flights’ 데이터셋을 불러온 후, pivot 함수를 사용하여 데이터를 피벗합니다. 그리고 heatmap 함수를 사용하여 히트맵을 그립니다. annot 매개변수를 True로 설정하면 각 셀에 값을 표시합니다. 색상 맵은 cmap 매개변수를 통해 지정할 수 있습니다.

교호작용 플롯

교호작용 플롯은 Seaborn에서 제공하는 interaction_plot 함수를 통해 그릴 수 있습니다. 이를 통해 두 개 이상의 요인이 결과 변수에 미치는 영향을 시각화할 수 있습니다.

import seaborn as sns
import matplotlib.pyplot as plt

# 데이터 불러오기
data = sns.load_dataset('tips')

# 교호작용 플롯 그리기
sns.interaction_plot(data['day'], data['sex'], data['tip'], colors=['blue', 'red'])

# 그래프 표시
plt.show()

위의 코드는 Seaborn에서 제공하는 ‘tips’ 데이터셋을 불러온 후, interaction_plot 함수를 사용하여 교호작용 플롯을 그리는 예제입니다. daysex 요인이 tip 결과 변수에 미치는 영향을 색상으로 구분하여 표시합니다.

이처럼 Seaborn을 사용하여 데이터의 특성 간 상호작용을 시각화하는 것은 데이터 분석의 중요한 단계입니다. 이를 통해 데이터의 패턴과 관계를 파악하여 모델링이나 예측에 활용할 수 있습니다.