[python] 판다스를 이용한 데이터 결합과 병합

판다스는 파이썬의 데이터 조작과 분석을 위한 강력한 라이브러리로, 다양한 기능을 제공합니다. 이 중에서 mergeconcat 함수를 사용하여 데이터프레임을 결합하고 병합할 수 있습니다.

데이터프레임 결합하기 (Concatenate DataFrames)

concat 함수를 사용하여 데이터프레임을 수직 또는 수평으로 결합할 수 있습니다. 간단한 예시를 살펴보겠습니다.

먼저, 다음과 같이 두 개의 데이터프레임을 생성합니다.

import pandas as pd

data1 = {'A': [1, 2, 3],
         'B': [4, 5, 6]}
df1 = pd.DataFrame(data1)

data2 = {'A': [7, 8, 9],
         'B': [10, 11, 12]}
df2 = pd.DataFrame(data2)

이제, 두 데이터프레임을 수직으로 결합해보겠습니다.

result_vertical = pd.concat([df1, df2])
print(result_vertical)

이제, 두 데이터프레임을 수평으로 결합해보겠습니다.

result_horizontal = pd.concat([df1, df2], axis=1)
print(result_horizontal)

데이터프레임 병합하기 (Merge DataFrames)

merge 함수를 사용하여 데이터프레임을 공통 열 또는 인덱스를 기준으로 병합할 수 있습니다. 다음은 간단한 예시입니다.

data1 = {'key': ['A', 'B', 'C', 'D'],
         'value': [1, 2, 3, 4]}
df1 = pd.DataFrame(data1)

data2 = {'key': ['B', 'D', 'E', 'F'],
         'value': [5, 6, 7, 8]}
df2 = pd.DataFrame(data2)

두 데이터프레임을 ‘key’ 열을 기준으로 병합해보겠습니다.

result = pd.merge(df1, df2, on='key')
print(result)

판다스의 concat 함수와 merge 함수를 사용하여 데이터프레임을 결합하고 병합함으로써, 데이터 조작과 분석 작업을 보다 효율적으로 수행할 수 있습니다.

참고 자료


이제, 여러분은 판다스를 사용하여 데이터프레임을 결합하고 병합하는 방법을 알게 되었습니다!