[python] 파이썬 pandas에서 데이터를 병합하는 방법은 무엇인가요?
1. merge
함수를 사용한 데이터 병합
merge
함수를 사용하여 공통 열(column)을 기준으로 데이터프레임을 병합할 수 있습니다.
예를 들어, 두 개의 데이터프레임 df1
과 df2
가 있고, 공통 열인 ‘key’를 기준으로 병합하려면 다음과 같이 코드를 작성합니다:
merged_df = pd.merge(df1, df2, on='key')
2. concat
함수를 사용한 데이터 결합
concat
함수를 사용하여 데이터프레임을 수직 또는 수평으로 결합할 수 있습니다.
예를 들어, 두 개의 데이터프레임 df1
과 df2
를 수직으로 결합하려면 다음과 같이 코드를 작성합니다:
concatenated_df = pd.concat([df1, df2])
3. join
함수를 사용한 데이터 조인
join
함수를 사용하여 인덱스를 기준으로 데이터프레임을 조인할 수 있습니다.
예를 들어, 두 개의 데이터프레임 df1
과 df2
를 조인하려면 다음과 같이 코드를 작성합니다:
joined_df = df1.join(df2, rsuffix='_other')
이러한 방법들을 사용하여 판다스에서 데이터를 효과적으로 병합할 수 있습니다.
참고 자료
- 판다스 공식 문서: Merge, join, and concatenate