[python] 파이썬 pandas에서 기본 통계 분석을 수행하는 방법은 무엇인가요?

20 Dec 2023

python

1. 기술 통계량 계산하기

import pandas as pd

# 데이터 프레임 생성 (예시)
data = {'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# 기술 통계량 계산
desc_stats = df.describe()
print(desc_stats)

2. 평균, 분산, 표준편차 등 직접 계산하기

# 평균 계산
mean = df['A'].mean()

# 분산 계산
variance = df['A'].var()

# 표준편차 계산
std_dev = df['A'].std()

print("평균:", mean)
print("분산:", variance)
print("표준편차:", std_dev)

3. 상관관계와 공분산 계산하기

# 상관관계 계산
correlation = df['A'].corr(df['B'])

# 공분산 계산
covariance = df['A'].cov(df['B'])

print("상관관계:", correlation)
print("공분산:", covariance)

팬더스의 다양한 함수를 활용하여 데이터프레임의 기본 통계 분석을 손쉽게 수행할 수 있습니다. 좀 더 자세한 내용은 팬더스 공식 문서를 참고하실 수 있습니다.