[python] 파이썬 pandas에서 데이터를 조합하는 방법은 무엇인가요?
데이터 조합 방법
- Concatenation (연결):
pd.concat
함수를 사용하여 행 또는 열을 기준으로 데이터프레임을 연결할 수 있습니다.import pandas as pd df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']}) df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']}) result = pd.concat([df1, df2]) # 행 기준 연결
- Merging (병합): 공통 열을 기준으로 데이터프레임을 병합할 수 있습니다.
df1 = pd.DataFrame({'key': ['K0', 'K1'], 'A': ['A0', 'A1']}) df2 = pd.DataFrame({'key': ['K0', 'K1'], 'B': ['B0', 'B1']}) result = pd.merge(df1, df2, on='key') # 'key' 열을 기준으로 병합
- Joining (결합): 인덱스를 기준으로 데이터프레임을 결합할 수 있습니다.
left = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']}, index=['K0', 'K1']) right = pd.DataFrame({'C': ['C0', 'C1'], 'D': ['D0', 'D1']}, index=['K0', 'K1']) result = left.join(right) # 인덱스를 기준으로 결합
위 방법들을 사용하여 원하는 형태로 데이터를 조합할 수 있으며, 데이터프레임의 구조와 조인 조건에 따라 적합한 방법을 선택할 수 있습니다. Pandas 공식 문서와 다양한 온라인 자료를 참고하시면 더 많은 도움을 받을 수 있습니다.