numpy
는 파이썬의 대표적인 수학 및 과학 연산 라이브러리로 유용한 집계 함수(aggregation function)를 제공합니다. 이러한 집계 함수를 사용하면 배열의 요소들을 통계적으로 분석하거나, 배열의 값을 합치거나 계산하는 등 다양한 연산을 수행할 수 있습니다.
대표적인 집계 함수
sum 함수
numpy
의 sum
함수는 배열의 모든 요소의 합을 계산합니다. 예를 들어, 다음과 같이 배열을 생성하고 sum
함수를 사용해 합을 계산할 수 있습니다.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
total = np.sum(arr)
print(total) # 출력: 15
mean 함수
mean
함수는 배열의 평균 값을 계산합니다. 아래 예제는 배열의 모든 요소의 평균을 계산하는 방법을 보여줍니다.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
avg = np.mean(arr)
print(avg) # 출력: 3.0
max 함수
max
함수는 배열의 최댓값을 반환합니다. 아래 예제는 배열에서 최댓값을 찾는 방법을 보여줍니다.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
max_value = np.max(arr)
print(max_value) # 출력: 5
min 함수
min
함수는 배열의 최솟값을 반환합니다. 아래 예제는 배열에서 최솟값을 찾는 방법을 보여줍니다.
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
min_value = np.min(arr)
print(min_value) # 출력: 1
집계 함수 활용 예제
집계 함수는 데이터 분석에서 주로 사용되며, 여러 가지 통계적인 연산을 수행할 때 유용합니다. 예를 들어, 다음과 같이 주어진 배열에서 최댓값과 최솟값을 찾을 수 있습니다.
import numpy as np
arr = np.array([5, 2, 7, 1, 9])
max_value = np.max(arr)
min_value = np.min(arr)
print("최댓값:", max_value)
print("최솟값:", min_value)
출력:
최댓값: 9
최솟값: 1
또한, 배열에 대해 다양한 통계적인 연산을 수행할 수 있습니다. 아래 예제는 주어진 배열의 평균, 분산, 표준편차를 계산하는 방법을 보여줍니다.
import numpy as np
arr = np.array([2, 4, 6, 8, 10])
avg = np.mean(arr)
variance = np.var(arr)
std_deviation = np.std(arr)
print("평균:", avg)
print("분산:", variance)
print("표준편차:", std_deviation)
출력:
평균: 6.0
분산: 8.0
표준편차: 2.8284271247461903
위 예제를 통해 numpy
의 집계 함수를 사용하여 배열 요소들을 쉽게 분석하고 계산할 수 있다는 것을 알 수 있습니다.
결론
numpy
의 집계 함수는 파이썬에서 수학 및 과학 연산을 쉽고 효율적으로 수행할 수 있도록 도와줍니다. 위 예제들은 sum
, mean
, max
, min
함수를 통해 배열의 합, 평균, 최댓값, 최솟값을 계산하는 방법을 보여줍니다. 이러한 집계 함수를 적절히 활용하면 데이터 분석 및 연산 작업을 보다 효율적으로 수행할 수 있습니다.