[python] 넘파이를 이용한 상관관계 분석
이 블로그 글에서는 파이썬의 넘파이 라이브러리를 사용하여 데이터 간 상관관계를 분석하는 방법에 대해 다루겠습니다.
상관관계란?
상관관계는 두 변수 간의 관련성을 나타내는 통계적인 척도입니다. 이 값은 -1에서 1 사이의 범위를 가지며, 1에 가까울수록 양의 상관관계가 강하고, -1에 가까울수록 음의 상관관계가 강합니다. 0에 가까울수록 두 변수 사이에는 상관관계가 거의 없다고 볼 수 있습니다.
넘파이를 이용한 상관관계 분석
먼저, 넘파이를 임포트합니다.
import numpy as np
두 변수 X와 Y가 담긴 배열을 생성합니다.
X = np.array([1, 2, 3, 4, 5])
Y = np.array([5, 4, 3, 2, 1])
np.corrcoef
함수를 사용하여 X와 Y의 상관관계를 계산합니다.
correlation = np.corrcoef(X, Y)[0, 1]
print(f"Correlation between X and Y: {correlation}")
상관관계를 계산하면 -1에 가까운 값이 나올 것입니다. 여기서는 X와 Y가 완벽한 음의 상관관계를 가지고 있기 때문입니다.
결론
이렇듯 넘파이를 활용하면 간단하게 데이터 간의 상관관계를 분석할 수 있습니다. 상관관계 분석을 통해 변수들 간의 관련성을 파악하여 데이터 분석 및 예측에 활용할 수 있습니다.
참고문헌: