[python] PDF 파일에서 특정 텍스트 교체하기
PDF 파일은 텍스트 교체를 위해 일반적으로 수정하기 어렵습니다. 그러나 Python의 PyPDF2 라이브러리를 사용하면 특정 텍스트를 교체하는 작업을 수행할 수 있습니다.
PyPDF2 설치하기
pip install PyPDF2
특정 텍스트 교체하기
다음은 PDF 파일에서 특정 텍스트를 교체하는 Python 코드의 예입니다.
from PyPDF2 import PdfReader, PdfWriter
def replace_text(pdf_path, old_text, new_text):
pdf = PdfReader(pdf_path)
writer = PdfWriter()
for page in pdf.pages:
page.extract_text() # 페이지의 텍스트를 추출하여 찾기 위해 사용
if old_text in page.extract_text():
modified_text = page.extract_text().replace(old_text, new_text)
page.set_text(modified_text)
writer.add_page(page)
with open("modified_pdf.pdf", "wb") as f:
writer.write(f)
replace_text("original_pdf.pdf", "Hello", "Hi")
위의 코드에서 replace_text
함수는 주어진 PDF 파일에서 지정된 텍스트를 찾고, 찾은 텍스트를 새로운 텍스트로 교체합니다. 그런 다음 수정된 PDF를 modified_pdf.pdf
로 저장합니다.
위의 코드를 실행하면 original_pdf.pdf
파일에서 “Hello”라는 텍스트를 “Hi”로 교체하는 PDF 파일을 생성할 수 있습니다.
결론
Python의 PyPDF2 라이브러리를 사용하면 PDF 파일에서 특정 텍스트를 교체하는 작업을 수행할 수 있습니다. 이를 통해 PDF 파일에 자동으로 텍스트를 수정하거나 업데이트할 수 있습니다.