[파이썬] pandas 인덱스 조작 및 재설정 (set_index, reset_index)
판다스(Pandas)는 파이썬으로 데이터를 다루기 위해 가장 널리 사용되는 라이브러리 중 하나입니다. 데이터프레임(DataFrame) 객체는 판다스에서 가장 중요한 자료구조로, 이를 효율적으로 다루기 위해 인덱스 조작 및 재설정 기능이 필요합니다.
set_index 함수
set_index
함수는 데이터프레임의 원하는 열을 기준으로 새로운 인덱스를 설정하는 기능을 수행합니다. 이를 통해 특정 열의 값을 인덱스로 사용하여 데이터프레임을 더 편리하게 다룰 수 있습니다.
import pandas as pd
# 예시 데이터프레임 생성
data = {'이름': ['홍길동', '김철수', '이영희'],
'나이': [25, 30, 28],
'성별': ['남', '남', '여']}
df = pd.DataFrame(data)
# '이름' 열을 인덱스로 설정
df = df.set_index('이름')
print(df)
위의 코드는 ‘이름’ 열을 인덱스로 설정하는 예시입니다. 실행 결과는 다음과 같습니다.
나이 성별
이름
홍길동 25 남
김철수 30 남
이영희 28 여
reset_index 함수
reset_index
함수는 인덱스를 기존의 정수형 인덱스로 재설정하는 기능을 수행합니다. 이를 통해 인덱스를 초기화하여 기존 데이터프레임의 순서를 복원할 수 있습니다.
import pandas as pd
# 예시 데이터프레임 생성
data = {'이름': ['홍길동', '김철수', '이영희'],
'나이': [25, 30, 28],
'성별': ['남', '남', '여']}
df = pd.DataFrame(data)
# '이름' 열을 인덱스로 설정
df = df.set_index('이름')
# 인덱스 초기화
df = df.reset_index()
print(df)
위의 코드는 인덱스를 초기화하는 예시입니다. 실행 결과는 다음과 같습니다.
이름 나이 성별
0 홍길동 25 남
1 김철수 30 남
2 이영희 28 여
정리
판다스의 set_index
와 reset_index
함수를 통해 데이터프레임의 인덱스를 조작하고 재설정하는 기능을 살펴보았습니다. 이를 활용하여 데이터프레임을 편리하게 다룰 수 있으며, 원하는 형태로 데이터를 구성할 수 있습니다. pandas 문서에서 더 자세한 내용을 확인하고 다양한 활용법에 익숙해지는 것이 좋습니다.