[python] 파이썬 pandas에서 데이터를 샘플링하는 방법은 무엇인가요?

1. 랜덤 샘플링: 데이터프레임에서 임의의 샘플을 추출하는 방법입니다. sample 메서드를 사용합니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'A': range(1, 11), 'B': range(11, 21)})

# 랜덤 샘플 추출
sampled_data = df.sample(n=3)  # n은 샘플 개수
print(sampled_data)

2. 일정한 간격으로 샘플링: 데이터프레임에서 일정한 간격으로 샘플을 추출하는 방법입니다. 인덱스 슬라이싱을 사용합니다.

import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({'A': range(1, 11), 'B': range(11, 21)})

# 일정 간격으로 샘플 추출
sampled_data = df[::2]  # 두 개씩 건너뛰어 샘플 추출
print(sampled_data)

데이터를 샘플링하는 방법은 분석의 목적 및 데이터의 특성에 따라 다를 수 있으며, 이러한 샘플링 기법을 적절히 활용하여 데이터를 처리하면 됩니다.