[python] 파이썬 pandas에서 데이터를 결합하는 방법은 무엇인가요?

데이터프레임 병합하기

merge() 함수

먼저, merge() 함수는 특정 열을 기준으로 데이터프레임을 병합하는데 사용됩니다. 다음은 두 개의 데이터프레임을 “key” 열을 기준으로 병합하는 예시입니다.

import pandas as pd

df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
                    'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
                    'value': [5, 6, 7, 8]})

merged_df = pd.merge(df1, df2, on='key', how='inner')
print(merged_df)

이 예제에서 on='key'는 연결할 열을 지정하는 것을 의미하며, how='inner'는 일치하는 값들만을 포함하는 내부 조인을 수행한다는 것을 나타냅니다.

concat() 함수

두 번째로, concat() 함수는 축을 따라 데이터프레임을 연결하는 데 사용됩니다. 다음은 두 개의 데이터프레임을 수직으로 연결하는 예시입니다.

concatenated_df = pd.concat([df1, df2])
print(concatenated_df)

이 예제에서는 기본적으로 축을 따라 수직으로 데이터프레임이 연결되므로, 두 데이터프레임의 열이 동일한 순서로 정렬돼야 합니다.

판다스의 merge()concat() 함수를 사용하여 데이터프레임을 결합하는 방법에 대해 간략히 알아보았습니다. 이러한 기능을 사용하여 데이터를 효과적으로 조작하고 분석할 수 있습니다.