[python] xlrd 모듈을 사용하여 엑셀 파일에서 중복 데이터 제거하기
우리는 때때로 엑셀 파일에서 중복 데이터를 제거해야 할 때가 있습니다. 파이썬의 XLrd 모듈은 엑셀 파일을 읽을 때 매우 유용합니다. 이 모듈을 사용하여 엑셀 파일에서 중복된 행을 제거하는 방법을 알아보겠습니다.
필요한 라이브러리 설치
먼저 XLrd 모듈을 설치해야 합니다. 아래 명령을 사용하여 설치할 수 있습니다.
pip install xlrd
중복 데이터 제거하기
다음은 XLrd 모듈을 사용하여 중복 데이터를 제거하는 예제 코드입니다.
import xlrd
# 엑셀 파일 열기
workbook = xlrd.open_workbook('파일명.xlsx')
# 시트 선택
sheet = workbook.sheet_by_index(0)
# 중복 제거할 열 인덱스
col_index = 0
# 중복 데이터 저장
unique_data = set()
# 중복 데이터 제거
for row in range(1, sheet.nrows):
cell_value = sheet.cell_value(row, col_index)
unique_data.add(cell_value)
# 중복 데이터가 제거된 결과 출력
print(unique_data)
이 코드는 첫 번째 열의 데이터를 기준으로 중복을 제거하고, 중복이 제거된 데이터를 출력합니다.
이제 XLrd 모듈을 사용하여 엑셀 파일에서 중복 데이터를 제거하는 방법을 익혔습니다. 이를 응용하여 실제 데이터를 처리할 수 있을 것입니다.
참고 자료
- XLrd 공식 문서: XLrd Documentation