[파이썬] pandas 인덱스 조작 및 재설정 (set_index, reset_index)

판다스(Pandas)는 파이썬으로 데이터를 다루기 위해 가장 널리 사용되는 라이브러리 중 하나입니다. 데이터프레임(DataFrame) 객체는 판다스에서 가장 중요한 자료구조로, 이를 효율적으로 다루기 위해 인덱스 조작 및 재설정 기능이 필요합니다.

set_index 함수

set_index 함수는 데이터프레임의 원하는 열을 기준으로 새로운 인덱스를 설정하는 기능을 수행합니다. 이를 통해 특정 열의 값을 인덱스로 사용하여 데이터프레임을 더 편리하게 다룰 수 있습니다.

import pandas as pd

# 예시 데이터프레임 생성
data = {'이름': ['홍길동', '김철수', '이영희'],
        '나이': [25, 30, 28],
        '성별': ['남', '남', '여']}
df = pd.DataFrame(data)

# '이름' 열을 인덱스로 설정
df = df.set_index('이름')

print(df)

위의 코드는 ‘이름’ 열을 인덱스로 설정하는 예시입니다. 실행 결과는 다음과 같습니다.

     나이 성별
이름        
홍길동  25  남
김철수  30  남
이영희  28  여

reset_index 함수

reset_index 함수는 인덱스를 기존의 정수형 인덱스로 재설정하는 기능을 수행합니다. 이를 통해 인덱스를 초기화하여 기존 데이터프레임의 순서를 복원할 수 있습니다.

import pandas as pd

# 예시 데이터프레임 생성
data = {'이름': ['홍길동', '김철수', '이영희'],
        '나이': [25, 30, 28],
        '성별': ['남', '남', '여']}
df = pd.DataFrame(data)

# '이름' 열을 인덱스로 설정
df = df.set_index('이름')

# 인덱스 초기화
df = df.reset_index()

print(df)

위의 코드는 인덱스를 초기화하는 예시입니다. 실행 결과는 다음과 같습니다.

   이름  나이 성별
0  홍길동  25  남
1  김철수  30  남
2  이영희  28  여

정리

판다스의 set_indexreset_index 함수를 통해 데이터프레임의 인덱스를 조작하고 재설정하는 기능을 살펴보았습니다. 이를 활용하여 데이터프레임을 편리하게 다룰 수 있으며, 원하는 형태로 데이터를 구성할 수 있습니다. pandas 문서에서 더 자세한 내용을 확인하고 다양한 활용법에 익숙해지는 것이 좋습니다.