[python] 판다스를 이용한 데이터 결합과 병합
판다스는 파이썬의 데이터 조작과 분석을 위한 강력한 라이브러리로, 다양한 기능을 제공합니다. 이 중에서 merge
와 concat
함수를 사용하여 데이터프레임을 결합하고 병합할 수 있습니다.
데이터프레임 결합하기 (Concatenate DataFrames)
concat
함수를 사용하여 데이터프레임을 수직 또는 수평으로 결합할 수 있습니다. 간단한 예시를 살펴보겠습니다.
먼저, 다음과 같이 두 개의 데이터프레임을 생성합니다.
import pandas as pd
data1 = {'A': [1, 2, 3],
'B': [4, 5, 6]}
df1 = pd.DataFrame(data1)
data2 = {'A': [7, 8, 9],
'B': [10, 11, 12]}
df2 = pd.DataFrame(data2)
이제, 두 데이터프레임을 수직으로 결합해보겠습니다.
result_vertical = pd.concat([df1, df2])
print(result_vertical)
이제, 두 데이터프레임을 수평으로 결합해보겠습니다.
result_horizontal = pd.concat([df1, df2], axis=1)
print(result_horizontal)
데이터프레임 병합하기 (Merge DataFrames)
merge
함수를 사용하여 데이터프레임을 공통 열 또는 인덱스를 기준으로 병합할 수 있습니다. 다음은 간단한 예시입니다.
data1 = {'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 4]}
df1 = pd.DataFrame(data1)
data2 = {'key': ['B', 'D', 'E', 'F'],
'value': [5, 6, 7, 8]}
df2 = pd.DataFrame(data2)
두 데이터프레임을 ‘key’ 열을 기준으로 병합해보겠습니다.
result = pd.merge(df1, df2, on='key')
print(result)
판다스의 concat
함수와 merge
함수를 사용하여 데이터프레임을 결합하고 병합함으로써, 데이터 조작과 분석 작업을 보다 효율적으로 수행할 수 있습니다.
참고 자료
- 판다스 공식 문서: https://pandas.pydata.org/pandas-docs/stable/
이제, 여러분은 판다스를 사용하여 데이터프레임을 결합하고 병합하는 방법을 알게 되었습니다!