[python] 판다스를 이용한 데이터 필터링과 정렬

판다스(pandas)는 파이썬에서 데이터 조작과 분석을 위한 라이브러리로, 데이터 필터링과 정렬을 위한 기능을 제공합니다. 이번 블로그 포스트에서는 판다스를 이용하여 데이터를 필터링하고 정렬하는 방법에 대해 알아보겠습니다.

데이터 필터링

DataFrame 객체를 사용하여 데이터를 필터링할 수 있습니다. 예를 들어, 특정 조건을 만족하는 행만 선택하거나, 특정 열의 값을 기준으로 데이터를 필터링할 수 있습니다.

import pandas as pd

# 예시 데이터프레임 생성
data = {'이름': ['철수', '영희', '순이', '민수'],
        '나이': [25, 30, 22, 28],
        '성별': ['남', '여', '여', '남']}
df = pd.DataFrame(data)

# 나이가 25 이상인 행 필터링
filtered_data = df[df['나이'] >= 25]
print(filtered_data)

위 예제에서는 나이 열의 값이 25 이상인 행만 필터링하여 출력하고 있습니다.

데이터 정렬

데이터를 정렬할 때에는 sort_values 메서드를 사용합니다. 이 메서드를 사용하여 특정 열을 기준으로 데이터를 정렬할 수 있습니다.

# 나이를 기준으로 오름차순 정렬
sorted_data = df.sort_values(by='나이')
print(sorted_data)

위 코드는 나이 열을 기준으로 데이터프레임을 오름차순으로 정렬한 후 출력하고 있습니다.

이처럼 판다스를 사용하면 데이터를 간편하게 필터링하고 정렬할 수 있으며, 데이터 분석 작업을 효율적으로 수행할 수 있습니다.

더 많은 정보는 Pandas 공식 문서를 참고하세요.

판다스 공식 문서