[python] 파이썬 pandas에서 데이터를 코딩하는 방법은 무엇인가요?
Pandas를 이용한 데이터 코딩 방법
- 데이터프레임 생성:
import pandas as pd data = {'이름': ['철수', '영희', '민수'], '나이': [25, 30, 27]} df = pd.DataFrame(data) print(df)
위의 예제에서는
pd.DataFrame()
함수를 사용하여 딕셔너리를 데이터프레임으로 변환하고, 이를 출력했습니다. - 데이터 불러오기:
df = pd.read_csv('파일명.csv')
위의 예제에서는
pd.read_csv()
함수를 사용하여 CSV 파일을 데이터프레임으로 불러왔습니다. - 데이터 조작:
df['나이_플러스_한살'] = df['나이'] + 1
위의 예제에서는 새로운 열을 추가하여 기존 데이터를 조작했습니다.
- 데이터 필터링:
filtered_data = df[df['나이'] > 25]
위의 예제에서는 조건에 맞는 데이터만 필터링하여 새로운 데이터프레임을 생성했습니다.
- 결측치 처리:
df.dropna() # 결측치가 포함된 행 제거 df.fillna(0) # 결측치를 0으로 대체
위의 예제에서는 결측치를 처리하는 방법을 보여주었습니다.
이러한 방법들은 pandas를 사용하여 데이터를 다루는 데 일반적으로 사용되는 몇 가지 기술입니다. pandas의 기능은 매우 다양하며, 데이터 과학 및 분석 작업에 유용하게 활용될 수 있는 강력한 도구입니다.
더 많은 기능과 활용 방법을 알아보려면 pandas 공식 문서를 참조하시기 바랍니다.