Seaborn으로 상관 행렬 시각화하기

상관 행렬은 데이터셋의 다양한 변수들 간의 상관관계를 나타내는 표입니다. 이를 시각화하여 패턴이나 상관관계를 쉽게 파악할 수 있습니다. Seaborn은 Python에서 데이터 시각화를 위한 라이브러리로, 상관 행렬을 시각화하는데 유용하게 사용될 수 있습니다.

1. 데이터 준비

Seaborn에서 제공하는 예제 데이터셋인 ‘tips’ 데이터를 활용하여 예제를 진행해 보겠습니다. 우선 Seaborn을 설치하고 ‘tips’ 데이터를 로드합니다.

# Seaborn 설치
!pip install seaborn

# 필요한 라이브러리들 임포트
import seaborn as sns

# 'tips' 데이터 로드
tips = sns.load_dataset('tips')

2. 상관 행렬 생성

tips 데이터셋에서 수치형 변수들 간의 상관 행렬을 생성합니다. corr() 함수를 사용하여 상관 행렬을 계산할 수 있습니다.

# 상관 행렬 생성
corr_matrix = tips.corr()

3. 상관 행렬 시각화

heatmap() 함수를 사용하여 상관 행렬을 시각화합니다.

# 상관 행렬 시각화
sns.heatmap(corr_matrix, cmap='coolwarm', annot=True)

위 코드를 실행하면, tips 데이터셋의 수치형 변수들 간의 상관 행렬이 색상으로 표시된 히트맵으로 출력됩니다. 색상이 진한 부분은 변수들 간의 강한 양의 상관관계를 나타내고, 색상이 밝은 부분은 약한 상관관계를 나타냅니다.

마무리

Seaborn을 사용하여 상관 행렬을 시각화하는 방법에 대해 알아보았습니다. 상관 행렬을 시각화함으로써 변수들 간의 관계를 한눈에 파악할 수 있으며, 데이터 분석에 도움이 될 수 있습니다.

Keywords: #Seaborn #상관행렬 #시각화