[파이썬][numpy] numpy에서 집계 함수

numpy는 파이썬의 대표적인 수학 및 과학 연산 라이브러리로 유용한 집계 함수(aggregation function)를 제공합니다. 이러한 집계 함수를 사용하면 배열의 요소들을 통계적으로 분석하거나, 배열의 값을 합치거나 계산하는 등 다양한 연산을 수행할 수 있습니다.

대표적인 집계 함수

sum 함수

numpysum 함수는 배열의 모든 요소의 합을 계산합니다. 예를 들어, 다음과 같이 배열을 생성하고 sum 함수를 사용해 합을 계산할 수 있습니다.

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
total = np.sum(arr)
print(total)  # 출력: 15

mean 함수

mean 함수는 배열의 평균 값을 계산합니다. 아래 예제는 배열의 모든 요소의 평균을 계산하는 방법을 보여줍니다.

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
avg = np.mean(arr)
print(avg)  # 출력: 3.0

max 함수

max 함수는 배열의 최댓값을 반환합니다. 아래 예제는 배열에서 최댓값을 찾는 방법을 보여줍니다.

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
max_value = np.max(arr)
print(max_value)  # 출력: 5

min 함수

min 함수는 배열의 최솟값을 반환합니다. 아래 예제는 배열에서 최솟값을 찾는 방법을 보여줍니다.

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
min_value = np.min(arr)
print(min_value)  # 출력: 1

집계 함수 활용 예제

집계 함수는 데이터 분석에서 주로 사용되며, 여러 가지 통계적인 연산을 수행할 때 유용합니다. 예를 들어, 다음과 같이 주어진 배열에서 최댓값과 최솟값을 찾을 수 있습니다.

import numpy as np

arr = np.array([5, 2, 7, 1, 9])
max_value = np.max(arr)
min_value = np.min(arr)

print("최댓값:", max_value)
print("최솟값:", min_value)

출력:

최댓값: 9
최솟값: 1

또한, 배열에 대해 다양한 통계적인 연산을 수행할 수 있습니다. 아래 예제는 주어진 배열의 평균, 분산, 표준편차를 계산하는 방법을 보여줍니다.

import numpy as np

arr = np.array([2, 4, 6, 8, 10])
avg = np.mean(arr)
variance = np.var(arr)
std_deviation = np.std(arr)

print("평균:", avg)
print("분산:", variance)
print("표준편차:", std_deviation)

출력:

평균: 6.0
분산: 8.0
표준편차: 2.8284271247461903

위 예제를 통해 numpy의 집계 함수를 사용하여 배열 요소들을 쉽게 분석하고 계산할 수 있다는 것을 알 수 있습니다.

결론

numpy의 집계 함수는 파이썬에서 수학 및 과학 연산을 쉽고 효율적으로 수행할 수 있도록 도와줍니다. 위 예제들은 sum, mean, max, min 함수를 통해 배열의 합, 평균, 최댓값, 최솟값을 계산하는 방법을 보여줍니다. 이러한 집계 함수를 적절히 활용하면 데이터 분석 및 연산 작업을 보다 효율적으로 수행할 수 있습니다.