[python] Seaborn을 사용한 다중 히트맵 그리기

Seaborn은 파이썬의 데이터 시각화 라이브러리로, 히트맵을 포함한 다양한 종류의 그래프를 간편하게 그릴 수 있습니다. 이번 글에서는 Seaborn을 사용하여 다중 히트맵을 그리는 방법을 알아보겠습니다.

필요한 패키지 설치

먼저 Seaborn을 사용하기 위해 다음 명령어를 사용하여 Seaborn 패키지를 설치해야 합니다.

!pip install seaborn

데이터 불러오기

히트맵을 그리기 위해 예제로 사용할 데이터를 불러와야 합니다. 이번 예제에서는 Seaborn에 내장된 타이타닉 데이터셋을 사용하도록 하겠습니다.

import seaborn as sns

# 타이타닉 데이터셋 불러오기
df = sns.load_dataset('titanic')

다중 히트맵 그리기

Seaborn의 heatmap() 함수를 사용하여 다중 히트맵을 그릴 수 있습니다. 다중 히트맵은 여러 개의 변수(특성) 간의 관계를 동시에 시각화할 때 유용합니다.

# 필요한 열 선택
columns = ['age', 'fare', 'pclass', 'survived']

# 변수 간의 상관관계 계산
corr = df[columns].corr()

# 히트맵 그리기
sns.heatmap(corr, annot=True, cmap='coolwarm')

위 코드에서 columns 변수에는 시각화할 변수들을 선택합니다. 그 후, corr 변수에는 선택한 변수들 간의 상관관계를 계산합니다. heatmap() 함수에 corr 변수를 전달하여 히트맵을 그릴 수 있습니다. annot=True는 각 셀에 숫자를 표시하고, cmap='coolwarm'은 색상 맵을 설정합니다.

결과 확인

위 코드를 실행하면 다중 히트맵이 그려집니다. 각 변수들 간의 상관관계를 시각적으로 확인할 수 있습니다.

다중 히트맵

결론

Seaborn을 사용하여 다중 히트맵을 그리는 방법을 알아보았습니다. 다중 히트맵은 여러 개의 변수 간의 상관관계를 한눈에 확인할 수 있어 데이터 분석 및 시각화에 유용한 도구입니다. Seaborn의 다양한 기능을 활용하여 데이터를 더욱 효과적으로 시각화할 수 있습니다.

참고 자료