[python] 파이썬 pandas에서 데이터를 코딩하는 방법은 무엇인가요?

Pandas를 이용한 데이터 코딩 방법

  1. 데이터프레임 생성:
    import pandas as pd
    
    data = {'이름': ['철수', '영희', '민수'], '나이': [25, 30, 27]}
    df = pd.DataFrame(data)
    print(df)
    

    위의 예제에서는 pd.DataFrame() 함수를 사용하여 딕셔너리를 데이터프레임으로 변환하고, 이를 출력했습니다.

  2. 데이터 불러오기:
    df = pd.read_csv('파일명.csv')
    

    위의 예제에서는 pd.read_csv() 함수를 사용하여 CSV 파일을 데이터프레임으로 불러왔습니다.

  3. 데이터 조작:
    df['나이_플러스_한살'] = df['나이'] + 1
    

    위의 예제에서는 새로운 열을 추가하여 기존 데이터를 조작했습니다.

  4. 데이터 필터링:
    filtered_data = df[df['나이'] > 25]
    

    위의 예제에서는 조건에 맞는 데이터만 필터링하여 새로운 데이터프레임을 생성했습니다.

  5. 결측치 처리:
    df.dropna()  # 결측치가 포함된 행 제거
    df.fillna(0)  # 결측치를 0으로 대체
    

    위의 예제에서는 결측치를 처리하는 방법을 보여주었습니다.

이러한 방법들은 pandas를 사용하여 데이터를 다루는 데 일반적으로 사용되는 몇 가지 기술입니다. pandas의 기능은 매우 다양하며, 데이터 과학 및 분석 작업에 유용하게 활용될 수 있는 강력한 도구입니다.

더 많은 기능과 활용 방법을 알아보려면 pandas 공식 문서를 참조하시기 바랍니다.