[파이썬] pandas에서 기본 통계 메서드 (mean, median, max, min)

pandas는 데이터 분석 및 조작을 위한 유용한 라이브러리입니다. 이번 포스트에서는 pandas의 기본 통계 메서드인 mean, median, max, min에 대해 알아보겠습니다. 이러한 메서드는 데이터프레임이나 시리즈 객체에서 각 열 또는 행의 통계적 요약을 계산하는 데 사용됩니다.

mean (평균)

mean 메서드는 열 또는 행의 평균 값을 계산합니다. 아래는 mean 메서드를 사용하여 특정 열의 평균을 계산하는 예시입니다.

import pandas as pd

# 데이터프레임 생성
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)

# 열의 평균 계산
mean_A = df['A'].mean()
mean_B = df['B'].mean()

print("A 열의 평균:", mean_A)
print("B 열의 평균:", mean_B)

평균 값을 계산하기 위해 mean 메서드를 사용하고 이를 변수에 할당합니다. 그 후, 변수를 출력하여 결과를 확인할 수 있습니다.

median (중앙값)

median 메서드는 열 또는 행의 중앙값을 계산합니다. 아래는 median 메서드를 사용하여 특정 열의 중앙값을 계산하는 예시입니다.

import pandas as pd

# 데이터프레임 생성
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)

# 열의 중앙값 계산
median_A = df['A'].median()
median_B = df['B'].median()

print("A 열의 중앙값:", median_A)
print("B 열의 중앙값:", median_B)

중앙값을 계산하기 위해 median 메서드를 사용하고 이를 변수에 할당합니다. 그 후, 변수를 출력하여 결과를 확인할 수 있습니다.

max (최댓값)

max 메서드는 열 또는 행의 최댓값을 계산합니다. 아래는 max 메서드를 사용하여 특정 열의 최댓값을 계산하는 예시입니다.

import pandas as pd

# 데이터프레임 생성
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)

# 열의 최댓값 계산
max_A = df['A'].max()
max_B = df['B'].max()

print("A 열의 최댓값:", max_A)
print("B 열의 최댓값:", max_B)

최댓값을 계산하기 위해 max 메서드를 사용하고 이를 변수에 할당합니다. 그 후, 변수를 출력하여 결과를 확인할 수 있습니다.

min (최솟값)

min 메서드는 열 또는 행의 최솟값을 계산합니다. 아래는 min 메서드를 사용하여 특정 열의 최솟값을 계산하는 예시입니다.

import pandas as pd

# 데이터프레임 생성
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)

# 열의 최솟값 계산
min_A = df['A'].min()
min_B = df['B'].min()

print("A 열의 최솟값:", min_A)
print("B 열의 최솟값:", min_B)

최솟값을 계산하기 위해 min 메서드를 사용하고 이를 변수에 할당합니다. 그 후, 변수를 출력하여 결과를 확인할 수 있습니다.

pandas의 mean, median, max, min 메서드를 사용하면 데이터프레임이나 시리즈의 열 또는 행에 대한 통계 정보를 쉽게 계산할 수 있습니다. 이를 통해 데이터의 중심 경향성과 최솟값, 최댓값을 파악할 수 있습니다.