[파이썬][Numpy] 집계 및 통계 연산의 다양한 예제

Numpy를 사용하여 데이터의 집계 및 통계 연산을 수행하는 다양한 예제를 제공하겠습니다.

집계 연산

  1. 배열 요소의 합 구하기:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 합계 구하기
sum_result = np.sum(arr)

print("합계:", sum_result)
  1. 평균 구하기:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 평균 구하기
mean_result = np.mean(arr)

print("평균:", mean_result)
  1. 중앙값 구하기:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 중앙값 구하기
median_result = np.median(arr)

print("중앙값:", median_result)

통계 연산

  1. 표준편차와 분산 구하기:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 표준편차와 분산 구하기
std_deviation = np.std(arr)
variance = np.var(arr)

print("표준편차:", std_deviation)
print("분산:", variance)
  1. 최솟값과 최댓값 구하기:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 최솟값과 최댓값 구하기
min_value = np.min(arr)
max_value = np.max(arr)

print("최솟값:", min_value)
print("최댓값:", max_value)
  1. 백분위수 계산하기:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

# 75번째 백분위수 계산
percentile_75th = np.percentile(arr, 75)

print("75번째 백분위수:", percentile_75th)
  1. 요소의 빈도수 계산하기:
import numpy as np

arr = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])

# 각 요소의 빈도수 계산
unique_values, counts = np.unique(arr, return_counts=True)

for val, count in zip(unique_values, counts):
    print(f"{val}의 빈도수: {count}")
  1. 상관 계수 계산하기:
import numpy as np

# 두 개의 배열 생성
arr1 = np.array([1, 2, 3, 4, 5])
arr2 = np.array([5, 4, 3, 2, 1])

# 상관 계수 계산
correlation = np.corrcoef(arr1, arr2)

print("상관 계수:")
print(correlation)

Numpy의 다양한 집계 및 통계 함수를 사용하면 데이터를 분석하고 요약하는 데 매우 유용합니다. 이러한 함수를 활용하면 데이터 분석 작업을 더 효율적으로 수행할 수 있습니다.