[python] 파이썬 pandas에서 데이터를 조인하는 방법은 무엇인가요?

판다스(Pandas)는 파이썬의 데이터 분석 및 조작을 위한 라이브러리로, 데이터 프레임과 시리즈를 효과적으로 다룰 수 있습니다. 데이터를 조인하는데에는 pd.merge() 함수를 주로 사용하며, 다양한 방법으로 데이터를 조인할 수 있습니다.

Inner Join (내부 조인)

내부 조인은 공통된 키 값을 기준으로 두 데이터프레임을 합칩니다. 예를 들어, pd.merge(df1, df2, on='key')과 같이 사용합니다.

import pandas as pd

# 두 데이터프레임을 내부 조인
result = pd.merge(left, right, on='key')

Left Join (왼쪽 조인), Right Join (오른쪽 조인)

왼쪽 조인과 오른쪽 조인은 각각 왼쪽 또는 오른쪽 데이터프레임을 기준으로 조인을 수행합니다. how 매개변수를 사용하여 조인 방법을 지정할 수 있습니다.

# 왼쪽 조인
result = pd.merge(left, right, how='left', on='key')

# 오른쪽 조인
result = pd.merge(left, right, how='right', on='key')

Outer Join (외부 조인)

외부 조인은 두 데이터프레임 중 어느 한쪽에만 있는 데이터도 모두 포함하여 조인합니다. how='outer'를 사용하여 외부 조인을 수행할 수 있습니다.

# 외부 조인
result = pd.merge(left, right, how='outer', on='key')

판다스에서 데이터를 조인하는 방법은 위와 같이 다양하게 제공되며, 데이터 조인을 효과적으로 수행하여 데이터 분석 작업을 보다 간편하게 할 수 있습니다.

참고문헌: pandas.merge() documentation