[python] NumPy를 사용하여 기초 통계 분석을 수행하는 방법은 무엇인가요?
NumPy는 파이썬에서 과학적이고 수치적인 연산을 위해 사용되는 핵심 패키지입니다. NumPy를 사용하여 배열과 행렬 기반의 데이터를 다룰 수 있으며, 기초 통계 분석에도 많이 활용됩니다.
먼저, NumPy를 설치해야 합니다. pip install numpy
명령을 사용하여 NumPy를 설치할 수 있습니다.
다음은 NumPy를 사용하여 기초 통계 분석을 수행하는 예시 코드입니다:
import numpy as np
# 데이터 생성
data = np.array([1, 2, 3, 4, 5])
# 평균 계산
mean = np.mean(data)
print("평균:", mean)
# 중앙값 계산
median = np.median(data)
print("중앙값:", median)
# 최댓값 계산
max_value = np.max(data)
print("최댓값:", max_value)
# 최솟값 계산
min_value = np.min(data)
print("최솟값:", min_value)
# 표준편차 계산
std_deviation = np.std(data)
print("표준편차:", std_deviation)
# 분산 계산
variance = np.var(data)
print("분산:", variance)
위 코드에서는 NumPy의 mean
, median
, max
, min
, std
, var
함수를 사용하여 평균, 중앙값, 최댓값, 최솟값, 표준편차, 분산을 계산합니다. 이 함수들은 NumPy 배열을 입력으로 받아 해당 통계 값을 반환합니다.
NumPy는 통계 분석에 필요한 다양한 함수와 기능을 제공합니다. 예를 들어, percentile
함수를 사용하여 백분위수를 계산하거나, histogram
함수를 사용하여 히스토그램을 생성할 수도 있습니다.
NumPy의 자세한 사용법에 대해서는 NumPy 공식 문서(https://numpy.org/doc/)를 참고하시기 바랍니다.