[python] 파이썬 pandas에서 데이터를 조작하는 방법은 무엇인가요?

데이터를 조작하는 데 pandas는 많이 사용되는 도구 중 하나입니다. pandas를 사용하여 데이터를 필터링, 정렬, 결합, 그룹화, 변환할 수 있습니다. 이러한 각각의 작업을 수행하는 방법에 대해 알아보겠습니다.

데이터 프레임 생성하기

import pandas as pd

data = {'이름': ['철수', '영희', '민수'],
        '나이': [25, 30, 21],
        '성별': ['남', '여', '남']}
df = pd.DataFrame(data)

데이터 필터링

# 나이가 25세 이상인 행 선택
filtered_data = df[df['나이'] >= 25]

데이터 정렬

# 나이를 기준으로 내림차순 정렬
sorted_data = df.sort_values(by='나이', ascending=False)

데이터 결합

data2 = {'이름': ['영수', '영자'],
         '나이': [28, 23],
         '성별': ['남', '여']}
df2 = pd.DataFrame(data2)

# 두 개의 데이터 프레임을 세로로 결합
combined_data = pd.concat([df, df2])

데이터 그룹화

# 성별로 그룹화하여 각 그룹에서의 평균 나이 계산
grouped_data = df.groupby('성별')['나이'].mean()

데이터 변환

# 나이를 기준으로 세 개의 나이 그룹으로 분류
df['나이_그룹'] = pd.cut(df['나이'], bins=[0, 20, 30, 100], labels=['10대', '20대', '30대 이상'])

pandas를 사용하여 다양한 방법으로 데이터를 조작할 수 있습니다. 자세한 내용은 pandas 공식 문서를 참조하시기 바랍니다.