[파이썬] matplotlib 통계적 그래프 그리기

Matplotlib은 파이썬에서 데이터 시각화를 위해 가장 널리 사용되는 라이브러리 중 하나입니다. 데이터를 시각화하면 통계적인 분석 결과를 쉽게 이해하고 전달할 수 있습니다. 이 블로그 포스트에서는 Matplotlib을 사용하여 통계적인 그래프를 그리는 방법을 알아보겠습니다.

히스토그램 그리기

히스토그램은 데이터의 분포를 시각화하는데 효과적인 그래프입니다. Matplotlib을 사용하여 히스토그램을 그릴 수 있습니다. 아래는 예시 코드입니다.

import matplotlib.pyplot as plt
import numpy as np

# 랜덤한 데이터 생성
data = np.random.randn(1000)

# 히스토그램 그리기
plt.hist(data, bins=30, color='steelblue', edgecolor='black')

# 그래프 제목과 축 레이블 설정하기
plt.title('Histogram of Random Data')
plt.xlabel('Value')
plt.ylabel('Frequency')

# 그래프 출력하기
plt.show()

이 코드를 실행하면 랜덤한 데이터의 히스토그램이 그려집니다. data 배열은 1000개의 랜덤한 숫자를 가지고 있으며, plt.hist() 함수를 통해 히스토그램을 그립니다. bins 인자는 히스토그램의 구간 개수를 나타내며, coloredgecolor 인자는 그래프의 색상과 가장자리 색상을 지정합니다.

상자 그림 그리기

상자 그림은 데이터의 분포를 시각화하는데 효과적인 그래프입니다. 이 그래프는 데이터의 최솟값, 최댓값, 중앙값 및 이상치 등을 한눈에 파악할 수 있습니다. Matplotlib을 사용하여 상자 그림을 그릴 수 있습니다. 아래는 예시 코드입니다.

import matplotlib.pyplot as plt
import numpy as np

# 랜덤한 데이터 생성
data = np.random.randn(100)

# 상자 그림 그리기
plt.boxplot(data)

# 그래프 제목과 축 레이블 설정하기
plt.title('Boxplot of Random Data')
plt.xlabel('Data')

# 그래프 출력하기
plt.show()

이 코드를 실행하면 랜덤한 데이터의 상자 그림이 그려집니다. data 배열에는 100개의 랜덤한 숫자가 들어있으며, plt.boxplot() 함수를 통해 상자 그림을 그립니다. plt.title() 함수로 그래프에 제목을, plt.xlabel() 함수로 x축에 레이블을 설정할 수 있습니다.

Matplotlib을 사용하여 통계적인 그래프를 그리는 방법에 대해서 알아보았습니다. 히스토그램과 상자 그림은 데이터의 분포와 이상치를 시각화하는데 유용한 도구입니다. 이러한 그래프를 통해 데이터를 더욱 효과적으로 분석하고 이해할 수 있습니다.