[python] PyPDF2 소개

PyPDF2는 Python에서 PDF 파일을 다루기 위한 강력한 라이브러리입니다. 이 라이브러리를 사용하면 PDF 파일의 내용을 읽고 편집할 수 있습니다. 다양한 기능을 제공하여, PDF 파일을 생성하고 분할하며, 페이지를 병합하고 보안을 설정할 수 있습니다.

설치하기

PyPDF2를 설치하려면 pip를 사용합니다. 아래의 명령을 터미널에서 실행하세요.

pip install PyPDF2

사용 예제

PDF 파일 열기

import PyPDF2

# PDF 파일 열기
with open('sample.pdf', 'rb') as file:
    pdf = PyPDF2.PdfFileReader(file)
    
    # 페이지 수 출력
    print(f"페이지 수: {pdf.numPages}")
    
    # 첫 페이지 출력하기
    first_page = pdf.getPage(0)
    print(first_page.extractText())

PDF 파일 생성하기

import PyPDF2

# 새로운 PDF 파일 생성
pdf = PyPDF2.PdfWriter()

# 페이지 추가하기
pdf.addPage(PyPDF2.pdf.PageObject())

# PDF 파일 저장하기
with open('new.pdf', 'wb') as file:
    pdf.write(file)

PDF 파일 병합하기

import PyPDF2

# 첫 번째 PDF 파일 열기
with open('file1.pdf', 'rb') as file1:
    # 두 번째 PDF 파일 열기
    with open('file2.pdf', 'rb') as file2:
        pdf1 = PyPDF2.PdfFileReader(file1)
        pdf2 = PyPDF2.PdfFileReader(file2)
        
        # 새로운 PDF 파일 생성
        merger = PyPDF2.PdfFileMerger()
        
        # 첫 번째 파일의 페이지 추가하기
        for page in range(pdf1.numPages):
            merger.append(pdf1.getPage(page))
        
        # 두 번째 파일의 페이지 추가하기
        for page in range(pdf2.numPages):
            merger.append(pdf2.getPage(page))
        
        # 새로운 파일로 저장하기
        merger.write('merged.pdf')

결론

PyPDF2는 Python 개발자들에게 PDF 파일을 다루는 데 매우 유용한 도구입니다. 다양한 기능을 제공하며, 사용하기 쉽고 강력한 성능을 가지고 있습니다. 이 라이브러리를 사용하여 PDF 파일을 읽고 편집하는 작업을 쉽게 수행할 수 있습니다.

더 자세한 정보는 PyPDF2 공식 문서를 참고하세요.