[python] 파이썬 pandas에서 데이터를 필터링하는 방법은 무엇인가요?
목차
행 필터링
Pandas에서는 다음과 같은 방법으로 특정 조건에 따라 행을 필터링할 수 있습니다.
import pandas as pd
# 데이터프레임 생성
data = {'이름': ['Alice', 'Bob', 'Charlie', 'David'],
'나이': [25, 30, 35, 40],
'성별': ['여', '남', '여', '남']}
df = pd.DataFrame(data)
# 나이가 30 이상인 행 필터링
filtered_df = df[df['나이'] >= 30]
print(filtered_df)
이 예제에서는 나이
열의 값이 30 이상인 행을 필터링하여 새로운 데이터프레임을 만듭니다.
열 필터링
Pandas를 사용하면 다음과 같은 방법으로 원하는 열을 선택할 수 있습니다.
# '이름'과 '성별' 열만 남기고 나머지 열은 제거
filtered_df = df[['이름', '성별']]
print(filtered_df)
이 예제에서는 ‘이름’과 ‘성별’ 열만을 선택하여 새로운 데이터프레임을 만듭니다.
참고 자료
- Pandas 공식 문서: Pandas 라이브러리의 공식 문서에서 데이터 필터링과 관련된 더 많은 정보를 찾을 수 있습니다.