Seaborn으로 상관 행렬 시각화하기

소개

상관 행렬은 데이터셋의 변수들 간의 상관관계를 보여주는 중요한 통계적 도구입니다. 상관 행렬을 시각화하면 변수 간의 관계를 한눈에 파악할 수 있어 데이터 분석과 시각화에 유용합니다. 이번 글에서는 Python의 시각화 라이브러리인 Seaborn을 사용하여 상관 행렬을 시각화하는 방법을 알아보겠습니다.

Seaborn 설치

Seaborn은 Anaconda를 설치했다면 이미 함께 설치되어 있을 것입니다. 그렇지 않은 경우, 다음 명령어를 사용하여 Seaborn을 설치할 수 있습니다.

pip install seaborn

상관 행렬 시각화 예제

다음은 Seaborn을 사용하여 상관 행렬을 시각화하는 예제 코드입니다.

import seaborn as sns
import pandas as pd

# 데이터 로드
df = pd.read_csv('data.csv')

# 상관 행렬 계산
correlation_matrix = df.corr()

# 상관 행렬 시각화
sns.heatmap(correlation_matrix, annot=True, cmap="YlGnBu")

# 그래프 제목 설정
plt.title("Correlation Matrix")

# 그래프 출력
plt.show()

위 코드에서는 Seaborn의 heatmap 함수를 사용하여 상관 행렬을 히트맵으로 시각화합니다. annot=True를 설정하면 각 셀에 상관 계수 값을 표시해줍니다. 또한, cmap 매개변수를 사용하여 히트맵의 색상을 설정할 수 있습니다.

결과 확인하기

위 예제 코드를 실행하면 상관 행렬을 시각화한 히트맵이 출력됩니다. 히트맵에서는 밝은 색으로 표시된 부분이 높은 상관관계를 가진 변수들을 의미합니다. 이를 통해 데이터셋의 변수 간의 관계를 쉽게 파악할 수 있습니다.

결론

Seaborn을 사용하면 상관 행렬을 간편하게 시각화할 수 있습니다. 상관 행렬을 시각화하면 변수 간의 관계를 더욱 직관적으로 파악할 수 있어 데이터 분석에 도움이 됩니다.


해시태그: #Seaborn #상관행렬 #히트맵