[python] 파이썬 pandas에서 데이터를 조합하는 방법은 무엇인가요?

데이터 조합 방법

  1. Concatenation (연결): pd.concat 함수를 사용하여 행 또는 열을 기준으로 데이터프레임을 연결할 수 있습니다.
    import pandas as pd
    
    df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
    df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
    
    result = pd.concat([df1, df2])  # 행 기준 연결
    
  2. Merging (병합): 공통 열을 기준으로 데이터프레임을 병합할 수 있습니다.
    df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1']})
    df2 = pd.DataFrame({'key': ['K0', 'K1'], 'B': ['B0', 'B1']})
    
    result = pd.merge(df1, df2, on='key')  # 'key' 열을 기준으로 병합
    
  3. Joining (결합): 인덱스를 기준으로 데이터프레임을 결합할 수 있습니다.
    left = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']}, index=['K0', 'K1'])
    right = pd.DataFrame({'C': ['C0', 'C1'], 'D': ['D0', 'D1']}, index=['K0', 'K1'])
    
    result = left.join(right)  # 인덱스를 기준으로 결합
    

    위 방법들을 사용하여 원하는 형태로 데이터를 조합할 수 있으며, 데이터프레임의 구조와 조인 조건에 따라 적합한 방법을 선택할 수 있습니다. Pandas 공식 문서와 다양한 온라인 자료를 참고하시면 더 많은 도움을 받을 수 있습니다.