[python] xlrd 엑셀 파일의 중복 데이터 확인하기
1. xlrd 라이브러리 설치
먼저, xlrd 라이브러리를 설치해야 합니다. 다음 명령으로 설치할 수 있습니다:
pip install xlrd
2. 중복 데이터 확인하기
다음은 xlrd 라이브러리를 사용하여 엑셀 파일에서 중복된 데이터를 확인하는 예제 코드입니다:
import xlrd
def find_duplicate_rows(file_path, sheet_name, key_column):
workbook = xlrd.open_workbook(file_path)
sheet = workbook.sheet_by_name(sheet_name)
data = [sheet.row_values(row) for row in range(sheet.nrows)]
header = data[0]
key_index = header.index(key_column)
unique_rows = []
duplicate_rows = []
for row in data[1:]:
if row[key_index] in [r[key_index] for r in unique_rows]:
duplicate_rows.append(row)
else:
unique_rows.append(row)
return unique_rows, duplicate_rows
file_path = "example.xlsx"
sheet_name = "Sheet1"
key_column = "ID"
unique, duplicates = find_duplicate_rows(file_path, sheet_name, key_column)
print("Unique Rows:")
for row in unique:
print(row)
print("Duplicate Rows:")
for row in duplicates:
print(row)
위의 예제 코드는 xlrd 라이브러리를 사용하여 주어진 엑셀 파일과 시트에서 중복된 행을 찾아내는 함수를 보여줍니다. 함수는 고유한 행과 중복된 행을 각각의 리스트로 반환합니다.
중복 데이터를 확인하는 데 유용한 xlrd 라이브러리를 사용하여 엑셀 파일의 중복된 데이터를 쉽게 처리할 수 있습니다.