[python] 판다스의 데이터 조작과 필터링

판다스(Pandas)는 파이썬에서 데이터를 분석하고 조작하는 데 유용한 라이브러리입니다. 이번 포스트에서는 판다스를 사용하여 데이터를 조작하고 필터링하는 방법을 살펴보겠습니다.

데이터프레임 생성

우선, 판다스의 데이터프레임을 생성해야 합니다. 다음은 예제 데이터프레임을 생성하는 코드입니다.

import pandas as pd

data = {'이름': ['철수', '영희', '민수', '수현'],
        '나이': [25, 30, 21, 35],
        '성별': ['남', '여', '남', '여']}
df = pd.DataFrame(data)
print(df)

조작

열 선택

특정 열을 선택하여 조회하려면 다음과 같이 코드를 작성할 수 있습니다.

names = df['이름']
print(names)

행 필터링

조건에 따라 특정 행을 필터링하려면 다음과 같이 코드를 작성할 수 있습니다.

female = df[df['성별'] == '여']
print(female)

새 열 추가

기존 열을 기반으로 새로운 열을 추가하려면 다음과 같이 코드를 작성할 수 있습니다.

df['나이 10년 후'] = df['나이'] + 10
print(df)

결론

이와 같이 판다스를 사용하여 데이터를 조작하고 필터링할 수 있습니다. 데이터프레임을 다룰 때 이러한 기능들을 유용하게 활용하여 데이터 분석 작업을 보다 효율적으로 수행할 수 있습니다.

참고 문헌: