[python] PyPDF2와 pdfrw 라이브러리 사용 예시
PyPDF2 라이브러리
PyPDF2는 Python에서 PDF 파일을 읽고 쓰는 데 사용할 수 있는 라이브러리입니다. 다양한 기능을 제공하며 간단한 예시로 알아보겠습니다.
설치 방법
pip install PyPDF2
예시 코드
import PyPDF2
# PDF 파일 열기
pdf_file = open('sample.pdf', 'rb')
# PDF 파일 읽기
pdf_reader = PyPDF2.PdfFileReader(pdf_file)
# 페이지 수 확인
num_pages = pdf_reader.numPages
# 첫 번째 페이지 출력
first_page = pdf_reader.getPage(0)
print(first_page.extract_text())
# PDF 파일 닫기
pdf_file.close()
위 코드는 sample.pdf
라는 파일을 열어 첫 번째 페이지를 출력하는 예시입니다. PdfFileReader
클래스를 사용하여 PDF 파일을 읽어올 수 있으며, getPage()
메소드로 원하는 페이지를 가져올 수 있습니다.
pdfrw 라이브러리
pdfrw는 Python에서 PDF 파일을 읽고 쓰는 라이브러리로, PyPDF2보다 더 다양한 기능을 제공합니다. 간단한 예시로 알아보겠습니다.
설치 방법
pip install pdfrw
예시 코드
import pdfrw
# PDF 파일 열기
pdf_file = "sample.pdf"
pdf = pdfrw.PdfReader(pdf_file)
# 페이지 수 확인
num_pages = len(pdf.pages)
# 첫 번째 페이지 출력
first_page = pdf.pages[0]
print(first_page)
# 필요한 작업 수행
# PDF 파일 저장
output_file = "output.pdf"
pdfrw.PdfWriter().write(output_file, pdf)
위 코드는 sample.pdf
파일을 열어 첫 번째 페이지를 출력하고, 필요한 작업을 수행한 후 output.pdf
파일로 저장하는 예시입니다. PdfReader
클래스로 PDF 파일을 읽어올 수 있으며, pages
속성을 사용하여 페이지에 접근할 수 있습니다. 마지막으로 PdfWriter
클래스로 수정된 PDF를 저장할 수 있습니다.
위 예시 코드들은 PyPDF2와 pdfrw 라이브러리의 간단한 사용 예시입니다. 더 자세한 사용 방법은 각 라이브러리의 문서를 참고하시기 바랍니다.