[python] NumPy를 사용하여 확률 분포를 생성하는 방법은 무엇인가요?

01 Dec 2023

python

NumPy는 파이썬에서 수치 계산을 위한 강력한 라이브러리로, 다양한 확률 분포를 생성하고 조작하는 기능을 제공합니다. 이를 활용하여 다양한 통계적 분석이나 모델링 작업을 수행할 수 있습니다. 이번 포스트에서는 NumPy를 사용하여 확률 분포를 생성하는 방법에 대해 알아보겠습니다.

NumPy에서 확률 분포를 생성하기 위해 사용되는 함수는 random 모듈에 포함되어 있습니다. 이 모듈에는 다양한 확률 분포를 생성하는 함수들이 있으며, 해당 분포의 특성에 맞게 파라미터를 설정하여 값을 생성할 수 있습니다.

아래는 몇 가지 흔히 사용되는 확률 분포와 해당 생성 함수의 예제입니다.

1. 정규 분포 (Normal Distribution)

정규 분포는 가장 널리 사용되는 확률 분포 중 하나로, 대표적인 예로 평균과 표준 편차를 가지는 데이터를 모델링할 때 사용됩니다. NumPy에서 정규 분포를 생성하기 위해 numpy.random.normal() 함수를 사용합니다.

import numpy as np

# 평균이 0이고 표준 편차가 1인 정규 분포에서 100개의 값을 생성합니다.
data = np.random.normal(0, 1, 100)

2. 이항 분포 (Binomial Distribution)

이항 분포는 두 가지 결과를 가지는 실험에서 성공하는 횟수를 모델링하는데 사용됩니다. NumPy에서 이항 분포를 생성하기 위해 numpy.random.binomial() 함수를 사용합니다.

import numpy as np

# 성공 확률이 0.3이고 10번의 시행에서 성공하는 횟수를 생성합니다.
data = np.random.binomial(10, 0.3)

3. 포아송 분포 (Poisson Distribution)

포아송 분포는 특정 단위 구간에서 사건이 발생하는 빈도를 모델링하는데 사용됩니다. NumPy에서 포아송 분포를 생성하기 위해 numpy.random.poisson() 함수를 사용합니다.

import numpy as np

# 평균 사건 발생 횟수가 5인 포아송 분포에서 값을 생성합니다.
data = np.random.poisson(5)

위의 예제는 일부 확률 분포의 생성 방법을 보여주기 위한 것이며, NumPy는 다양한 확률 분포 생성 함수를 제공합니다. 이를 활용하여 데이터 분석이나 통계 모델링에 필요한 데이터를 생성할 수 있습니다.

NumPy 공식 문서에서 더 많은 확률 분포 생성 함수와 파라미터에 대한 정보를 확인할 수 있습니다.

NumPy 공식 문서: https://numpy.org/doc/