[python] 파이썬 pandas에서 데이터를 관리하는 방법은 무엇인가요?

데이터프레임(DataFrame) 생성

import pandas as pd

# 딕셔너리를 사용하여 데이터프레임 생성
data = {'이름': ['철수', '영희', '영수'],
        '나이': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)

데이터 불러오기 및 저장하기

# CSV 파일 불러오기
df = pd.read_csv('file.csv')

# 데이터프레임을 CSV 파일로 저장하기
df.to_csv('new_file.csv', index=False)

데이터 조작

# 열 선택
print(df['이름'])

# 조건에 따른 행 필터링
print(df[df['나이'] > 25])

# 새로운 열 추가
df['성별'] = ['남', '여', '남']
print(df)

데이터 시각화

import matplotlib.pyplot as plt

# 히스토그램 그리기
df['나이'].plot(kind='hist')
plt.show()

판다스를 사용하면 데이터를 효과적으로 관리하고 분석할 수 있으며, 충분한 연습을 통해 데이터 분석 역량을 향상시킬 수 있습니다.

참고 문헌: