[python] NumPy에서 배열 요소간의 상관 관계를 계산하는 방법은 무엇인가요?

NumPy는 파이썬에서 과학적 계산을 위한 강력한 라이브러리입니다. NumPy의 corrcoef() 함수를 사용하여 배열 요소간의 상관 관계를 계산할 수 있습니다. 이 함수는 주어진 배열의 상관 계수 행렬을 반환합니다.

import numpy as np

# 예시 배열 생성
x = np.array([1, 2, 3, 4, 5])
y = np.array([5, 6, 7, 8, 9])

# 상관 계수 계산
corr_matrix = np.corrcoef(x, y)

# 결과 출력
print(corr_matrix)

위 코드에서 corrcoef() 함수는 xy 배열의 상관 계수를 계산합니다. 계산된 상관 계수 행렬은 2x2 크기의 배열로 반환됩니다. 상관 계수 행렬의 대각선 요소는 해당 변수의 자기 자신과의 상관 계수이며, (0, 1) 및 (1, 0) 요소는 xy 배열 간의 상관 계수입니다.

결과는 다음과 같이 출력됩니다:

[[1.         0.99999998]
 [0.99999998 1.        ]]

이러한 상관 계수는 xy 배열 사이의 선형 관계의 강도를 측정하는 데 사용됩니다. 상관 계수의 값은 -1에서 1 사이의 범위를 가질 수 있으며, 1에 가까울수록 더 강한 양의 상관 관계를 나타냅니다. 마찬가지로, -1에 가까울수록 음의 상관 관계를 나타냅니다. 0은 선형 상관 관계가 없음을 나타냅니다.

참고 문서: