[python] 파이썬 pandas에서 데이터를 결합하는 방법은 무엇인가요?

데이터프레임을 열을 기준으로 결합

여러 데이터프레임을 동일한 열을 기준으로 결합하려면 merge 함수를 사용할 수 있습니다. 예를 들어, 두 개의 데이터프레임을 ‘key’ 열을 기준으로 결합하는 경우 다음과 같이 수행할 수 있습니다:

import pandas as pd

df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
                    'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
                    'value': [5, 6, 7, 8]})

merged_df = pd.merge(df1, df2, on='key')

이것은 ‘key’ 열을 기준으로 두 데이터프레임을 결합합니다.

데이터프레임을 행을 기준으로 결합

또 다른 방법은 concat 함수를 사용하여 여러 데이터프레임을 수직 또는 수평으로 결합하는 것입니다. 기본적으로 행을 따라 결합되며, axis 매개변수를 사용하여 열을 따라 결합할 수도 있습니다.

concatenated_df = pd.concat([df1, df2])

이것은 두 데이터프레임을 수직으로 결합하여 새로운 데이터프레임을 생성합니다.

참고 자료

판다스 공식 문서

위의 예제 코드와 설명은 파이썬 3 및 pandas 1.0 버전 기준으로 작성되었습니다.