[python] xlrd 중복 데이터 제거 후 새로운 엑셀 파일 생성하기

목차

  1. 소개
  2. 필요한 라이브러리 설치
  3. 중복 데이터 제거하기
  4. 새로운 엑셀 파일 생성하기
  5. 마무리

1. 소개

이번 포스트에서는 Python의 xlrd 라이브러리를 사용하여 엑셀 파일에서 중복 데이터를 제거하고, 그 결과를 새로운 엑셀 파일로 생성하는 방법에 대해 알아보겠습니다.

2. 필요한 라이브러리 설치

먼저, xlrd 라이브러리가 설치되어 있지 않다면 다음 명령을 사용하여 설치합니다.

pip install xlrd

3. 중복 데이터 제거하기

중복 데이터를 제거하기 위해서는 엑셀 파일을 읽어와야 합니다. 다음은 xlrd를 사용하여 엑셀 파일을 읽고 중복 데이터를 제거하는 예제 코드입니다.

import xlrd
from collections import OrderedDict

workbook = xlrd.open_workbook('input.xlsx')
sheet = workbook.sheet_by_index(0)

data = [sheet.row_values(row) for row in range(1, sheet.nrows)]
filtered_data = [i for n, i in enumerate(data) if i not in data[n + 1:]]

위 코드는 ‘input.xlsx’ 파일에서 데이터를 읽어와서 중복을 제거한 뒤, filtered_data에 저장하는 예제입니다.

4. 새로운 엑셀 파일 생성하기

중복이 제거된 데이터를 새로운 엑셀 파일로 저장하기 위해서는 xlwt 또는 openpyxl과 같은 라이브러리가 필요합니다.

import openpyxl

workbook = openpyxl.Workbook()
sheet = workbook.active

for row in filtered_data:
    sheet.append(row)

workbook.save('output.xlsx')

위 코드는 중복이 제거된 데이터를 ‘output.xlsx’ 파일로 저장하는 예제입니다.

5. 마무리

본 포스트에서는 Python의 xlrd 라이브러리를 사용하여 중복 데이터를 제거하고 새로운 엑셀 파일을 생성하는 방법에 대해 알아보았습니다. 필요한 라이브러리를 설치하고, 예제 코드를 통해 실제로 데이터를 처리하는 방법을 살펴보았습니다. 이를 통해 업무나 개인 프로젝트에서 엑셀 파일을 다룰 때 유용하게 활용할 수 있을 것입니다.

References