[python] PyPDF2와 PyPDF4 라이브러리 사용 예시

많은 기능과 유연성을 제공하는 Python 라이브러리인 PyPDF2PyPDF4는 PDF 파일을 다루는데 사용됩니다. 이 라이브러리들은 간단하고 직관적인 인터페이스를 제공하여 PDF 문서를 읽고 쓰는 작업을 쉽게 할 수 있게 해줍니다.

PyPDF2 라이브러리 사용 예시

PDF 파일 읽기

import PyPDF2

# PDF 파일 열기
with open('example.pdf', 'rb') as file:
    pdf_reader = PyPDF2.PdfFileReader(file)

    # 페이지 수 출력
    num_pages = pdf_reader.numPages
    print(f"페이지 수: {num_pages}")

    # 특정 페이지의 텍스트 읽기
    page = pdf_reader.getPage(0)
    text = page.extractText()
    print(text)

PDF 파일 쓰기

import PyPDF2

# 새로운 PDF 파일 생성
pdf_writer = PyPDF2.PdfFileWriter()

# 페이지 추가
page = PyPDF2.PageObject()
page.mergePage(pdf_reader.getPage(0))
pdf_writer.addPage(page)

# PDF 파일 저장
with open('output.pdf', 'wb') as file:
    pdf_writer.write(file)

PyPDF4 라이브러리 사용 예시

PDF 파일 분할

import PyPDF4

# PDF 파일 열기
with open('example.pdf', 'rb') as file:
    pdf_reader = PyPDF4.PdfFileReader(file)

    # 페이지 수 출력
    num_pages = pdf_reader.numPages
    print(f"페이지 수: {num_pages}")

    # 각 페이지를 개별 파일로 저장
    for page_num in range(num_pages):
        pdf_writer = PyPDF4.PdfFileWriter()
        page = pdf_reader.getPage(page_num)
        pdf_writer.addPage(page)

        with open(f"page_{page_num+1}.pdf", 'wb') as output_file:
            pdf_writer.write(output_file)

PDF 파일 병합

import PyPDF4

# PDF 파일 병합
pdf_merger = PyPDF4.PdfFileMerger()

# 병합할 PDF 파일 추가
pdf_merger.append('file1.pdf')
pdf_merger.append('file2.pdf')

# PDF 파일 저장
pdf_merger.write('merged.pdf')
pdf_merger.close()

위 예시 코드를 이용해서 PyPDF2PyPDF4 라이브러리를 사용하여 PDF 파일을 읽고 쓰는 작업을 수행할 수 있습니다. 이 라이브러리들은 많은 다른 기능도 제공하므로 공식 문서를 참조하는 것이 좋습니다.

참고 자료