[python] xlrd 모듈을 사용하여 엑셀 파일에서 중복 데이터 제거하기

우리는 때때로 엑셀 파일에서 중복 데이터를 제거해야 할 때가 있습니다. 파이썬의 XLrd 모듈은 엑셀 파일을 읽을 때 매우 유용합니다. 이 모듈을 사용하여 엑셀 파일에서 중복된 행을 제거하는 방법을 알아보겠습니다.

필요한 라이브러리 설치

먼저 XLrd 모듈을 설치해야 합니다. 아래 명령을 사용하여 설치할 수 있습니다.

pip install xlrd

중복 데이터 제거하기

다음은 XLrd 모듈을 사용하여 중복 데이터를 제거하는 예제 코드입니다.

import xlrd

# 엑셀 파일 열기
workbook = xlrd.open_workbook('파일명.xlsx')

# 시트 선택
sheet = workbook.sheet_by_index(0)

# 중복 제거할 열 인덱스
col_index = 0

# 중복 데이터 저장
unique_data = set()

# 중복 데이터 제거
for row in range(1, sheet.nrows):
    cell_value = sheet.cell_value(row, col_index)
    unique_data.add(cell_value)

# 중복 데이터가 제거된 결과 출력
print(unique_data)

이 코드는 첫 번째 열의 데이터를 기준으로 중복을 제거하고, 중복이 제거된 데이터를 출력합니다.

이제 XLrd 모듈을 사용하여 엑셀 파일에서 중복 데이터를 제거하는 방법을 익혔습니다. 이를 응용하여 실제 데이터를 처리할 수 있을 것입니다.

참고 자료