[python] xlrd 엑셀 파일의 중복 데이터 확인하기

1. xlrd 라이브러리 설치

먼저, xlrd 라이브러리를 설치해야 합니다. 다음 명령으로 설치할 수 있습니다:

pip install xlrd

2. 중복 데이터 확인하기

다음은 xlrd 라이브러리를 사용하여 엑셀 파일에서 중복된 데이터를 확인하는 예제 코드입니다:

import xlrd

def find_duplicate_rows(file_path, sheet_name, key_column):
    workbook = xlrd.open_workbook(file_path)
    sheet = workbook.sheet_by_name(sheet_name)

    data = [sheet.row_values(row) for row in range(sheet.nrows)]
    header = data[0]
    key_index = header.index(key_column)

    unique_rows = []
    duplicate_rows = []

    for row in data[1:]:
        if row[key_index] in [r[key_index] for r in unique_rows]:
            duplicate_rows.append(row)
        else:
            unique_rows.append(row)

    return unique_rows, duplicate_rows

file_path = "example.xlsx"
sheet_name = "Sheet1"
key_column = "ID"
unique, duplicates = find_duplicate_rows(file_path, sheet_name, key_column)

print("Unique Rows:")
for row in unique:
    print(row)
print("Duplicate Rows:")
for row in duplicates:
    print(row)

위의 예제 코드는 xlrd 라이브러리를 사용하여 주어진 엑셀 파일과 시트에서 중복된 행을 찾아내는 함수를 보여줍니다. 함수는 고유한 행과 중복된 행을 각각의 리스트로 반환합니다.

중복 데이터를 확인하는 데 유용한 xlrd 라이브러리를 사용하여 엑셀 파일의 중복된 데이터를 쉽게 처리할 수 있습니다.