[python] 파이썬 pandas에서 데이터를 조인하는 방법은 무엇인가요?
판다스(Pandas)는 파이썬의 데이터 분석 및 조작을 위한 라이브러리로, 데이터 프레임과 시리즈를 효과적으로 다룰 수 있습니다. 데이터를 조인하는데에는 pd.merge()
함수를 주로 사용하며, 다양한 방법으로 데이터를 조인할 수 있습니다.
Inner Join (내부 조인)
내부 조인은 공통된 키 값을 기준으로 두 데이터프레임을 합칩니다. 예를 들어, pd.merge(df1, df2, on='key')
과 같이 사용합니다.
import pandas as pd
# 두 데이터프레임을 내부 조인
result = pd.merge(left, right, on='key')
Left Join (왼쪽 조인), Right Join (오른쪽 조인)
왼쪽 조인과 오른쪽 조인은 각각 왼쪽 또는 오른쪽 데이터프레임을 기준으로 조인을 수행합니다. how
매개변수를 사용하여 조인 방법을 지정할 수 있습니다.
# 왼쪽 조인
result = pd.merge(left, right, how='left', on='key')
# 오른쪽 조인
result = pd.merge(left, right, how='right', on='key')
Outer Join (외부 조인)
외부 조인은 두 데이터프레임 중 어느 한쪽에만 있는 데이터도 모두 포함하여 조인합니다. how='outer'
를 사용하여 외부 조인을 수행할 수 있습니다.
# 외부 조인
result = pd.merge(left, right, how='outer', on='key')
판다스에서 데이터를 조인하는 방법은 위와 같이 다양하게 제공되며, 데이터 조인을 효과적으로 수행하여 데이터 분석 작업을 보다 간편하게 할 수 있습니다.
참고문헌: pandas.merge() documentation