[python] NumPy에서 통계 연산을 수행하는 방법은 무엇인가요?

01 Dec 2023

python

NumPy는 파이썬에서 널리 사용되는 과학적 계산을 위한 라이브러리입니다. 특히, 배열과 행렬 연산에 특화되어 있어 통계 분석을 위한 다양한 기능을 제공합니다. 이제 NumPy를 사용하여 통계 연산을 수행하는 방법을 알아보겠습니다.

평균(Mean) 계산하기

NumPy에서 평균을 계산하려면 mean() 함수를 사용합니다. 다음은 예시 코드입니다.

import numpy as np

data = np.array([1, 2, 3, 4, 5])
mean = np.mean(data)

print("평균:", mean)

위 코드에서는 NumPy 모듈을 np로 임포트하고, np.mean() 함수를 사용하여 data 배열의 평균을 계산합니다. 계산 결과는 mean 변수에 저장되고 출력됩니다.

중앙값(Median) 계산하기

중앙값은 주어진 데이터에서 중간에 위치한 값입니다. NumPy에서 중앙값을 계산하려면 median() 함수를 사용합니다. 다음은 예시 코드입니다.

import numpy as np

data = np.array([1, 2, 3, 4, 5])
median = np.median(data)

print("중앙값:", median)

위 코드에서는 np.median() 함수를 사용하여 data 배열의 중앙값을 계산합니다. 계산 결과는 median 변수에 저장되고 출력됩니다.

표준편차(Standard Deviation) 계산하기

표준편차는 데이터의 산포도를 나타내는 지표로, 값이 클수록 데이터가 분산되어 있음을 의미합니다. NumPy에서 표준편차를 계산하려면 std() 함수를 사용합니다. 다음은 예시 코드입니다.

import numpy as np

data = np.array([1, 2, 3, 4, 5])
std = np.std(data)

print("표준편차:", std)

위 코드에서는 np.std() 함수를 사용하여 data 배열의 표준편차를 계산합니다. 계산 결과는 std 변수에 저장되고 출력됩니다.

그 외 통계 연산

NumPy는 평균, 중앙값, 표준편차 외에도 다양한 통계 연산을 지원합니다. 예를 들어, 최댓값(max()), 최솟값(min()), 분위수(percentile()), 상관계수(corrcoef()), 공분산(cov()), 히스토그램(histogram()) 등을 계산할 수 있습니다.

NumPy에서 제공하는 통계 연산의 전체 목록과 사용 방법은 NumPy 공식 문서에서 확인할 수 있습니다.

NumPy를 사용하여 데이터의 통계를 쉽고 빠르게 계산할 수 있으므로, 데이터 분석이나 과학 연구에서 많이 활용되고 있습니다.