[python] PyPDF2와 pdfrw 라이브러리 사용 예시

PyPDF2 라이브러리

PyPDF2는 Python에서 PDF 파일을 읽고 쓰는 데 사용할 수 있는 라이브러리입니다. 다양한 기능을 제공하며 간단한 예시로 알아보겠습니다.

설치 방법

pip install PyPDF2

예시 코드

import PyPDF2

# PDF 파일 열기
pdf_file = open('sample.pdf', 'rb')

# PDF 파일 읽기
pdf_reader = PyPDF2.PdfFileReader(pdf_file)

# 페이지 수 확인
num_pages = pdf_reader.numPages

# 첫 번째 페이지 출력
first_page = pdf_reader.getPage(0)
print(first_page.extract_text())

# PDF 파일 닫기
pdf_file.close()

위 코드는 sample.pdf라는 파일을 열어 첫 번째 페이지를 출력하는 예시입니다. PdfFileReader 클래스를 사용하여 PDF 파일을 읽어올 수 있으며, getPage() 메소드로 원하는 페이지를 가져올 수 있습니다.

pdfrw 라이브러리

pdfrw는 Python에서 PDF 파일을 읽고 쓰는 라이브러리로, PyPDF2보다 더 다양한 기능을 제공합니다. 간단한 예시로 알아보겠습니다.

설치 방법

pip install pdfrw

예시 코드

import pdfrw

# PDF 파일 열기
pdf_file = "sample.pdf"
pdf = pdfrw.PdfReader(pdf_file)

# 페이지 수 확인
num_pages = len(pdf.pages)

# 첫 번째 페이지 출력
first_page = pdf.pages[0]
print(first_page)

# 필요한 작업 수행

# PDF 파일 저장
output_file = "output.pdf"
pdfrw.PdfWriter().write(output_file, pdf)

위 코드는 sample.pdf 파일을 열어 첫 번째 페이지를 출력하고, 필요한 작업을 수행한 후 output.pdf 파일로 저장하는 예시입니다. PdfReader 클래스로 PDF 파일을 읽어올 수 있으며, pages 속성을 사용하여 페이지에 접근할 수 있습니다. 마지막으로 PdfWriter 클래스로 수정된 PDF를 저장할 수 있습니다.

위 예시 코드들은 PyPDF2와 pdfrw 라이브러리의 간단한 사용 예시입니다. 더 자세한 사용 방법은 각 라이브러리의 문서를 참고하시기 바랍니다.

참고 자료