[python] PDF 파일에서 특정 텍스트 교체하기

PDF 파일은 텍스트 교체를 위해 일반적으로 수정하기 어렵습니다. 그러나 Python의 PyPDF2 라이브러리를 사용하면 특정 텍스트를 교체하는 작업을 수행할 수 있습니다.

PyPDF2 설치하기

pip install PyPDF2

특정 텍스트 교체하기

다음은 PDF 파일에서 특정 텍스트를 교체하는 Python 코드의 예입니다.

from PyPDF2 import PdfReader, PdfWriter

def replace_text(pdf_path, old_text, new_text):
    pdf = PdfReader(pdf_path)
    writer = PdfWriter()

    for page in pdf.pages:
        page.extract_text()  # 페이지의 텍스트를 추출하여 찾기 위해 사용

        if old_text in page.extract_text():
            modified_text = page.extract_text().replace(old_text, new_text)
            page.set_text(modified_text)
        
        writer.add_page(page)

    with open("modified_pdf.pdf", "wb") as f:
        writer.write(f)

replace_text("original_pdf.pdf", "Hello", "Hi")

위의 코드에서 replace_text 함수는 주어진 PDF 파일에서 지정된 텍스트를 찾고, 찾은 텍스트를 새로운 텍스트로 교체합니다. 그런 다음 수정된 PDF를 modified_pdf.pdf로 저장합니다.

위의 코드를 실행하면 original_pdf.pdf 파일에서 “Hello”라는 텍스트를 “Hi”로 교체하는 PDF 파일을 생성할 수 있습니다.

결론

Python의 PyPDF2 라이브러리를 사용하면 PDF 파일에서 특정 텍스트를 교체하는 작업을 수행할 수 있습니다. 이를 통해 PDF 파일에 자동으로 텍스트를 수정하거나 업데이트할 수 있습니다.