[파이썬] pandas 데이터프레임의 rank 및 quantile

데이터프레임(DataFrame)은 pandas 패키지에서 제공하는 강력한 데이터 구조입니다. 데이터프레임은 행과 열로 구성된 테이블 형태의 데이터를 다루는 데 유용하며, 다양한 기능을 제공합니다. 이 중에서 rank(순위)와 quantile(백분위수)는 데이터프레임에서 자주 사용되는 기능입니다.

Rank(순위) 계산하기

데이터프레임에서 rank를 계산하는 방법은 rank() 메서드를 사용하는 것입니다. 이 메서드는 각 요소에 대해 순위를 계산하여 새로운 데이터프레임을 반환합니다.

import pandas as pd

# 예시 데이터프레임 생성
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'Dave'],
                   'Score': [75, 80, 85, 90]})

# 순위 계산
df['Rank'] = df['Score'].rank()

print(df)

위의 코드는 각 학생의 이름과 점수를 포함하는 데이터프레임을 생성하고, Score 열에 대해 rank() 메서드를 호출하여 순위를 계산합니다. 이후, Rank 열을 생성하여 순위를 할당한 데이터프레임을 출력합니다.

Quantile(백분위수) 계산하기

데이터프레임에서 quantile을 계산하는 방법은 quantile() 메서드를 사용하는 것입니다. 이 메서드는 데이터의 분포를 분석하여 특정 백분위수에 해당하는 값을 계산합니다.

import pandas as pd

# 예시 데이터프레임 생성
df = pd.DataFrame({'Value': [10, 20, 30, 40, 50]})

# 특정 백분위수 계산 (예: 75%)
quantile_value = df['Value'].quantile(0.75)

print(f"The 75th percentile value is: {quantile_value}")

위의 코드는 Value 열에 대해 quantile() 메서드를 호출하여 75% 백분위수에 해당하는 값을 계산합니다. 이후, 계산된 값을 출력합니다.

데이터프레임에서 rank와 quantile을 계산하는 것은 데이터의 순서와 분포를 이해하는 데 도움이 됩니다. 이를 통해 데이터를 비교하거나 이상치를 탐지하는 등의 작업을 수행할 수 있습니다. pandas를 활용하여 rank와 quantile을 계산해보세요!