[python] PDF 파일에서 특정 영역 붙여넣기
이번 포스트에서는 Python을 사용하여 PDF 파일에서 특정 영역을 추출하여 다른 문서에 붙여넣는 방법에 대해 알아보겠습니다.
PDF 파일은 텍스트와 이미지 등 다양한 유형의 콘텐츠를 담고 있으며, 때로는 특정 페이지나 영역의 내용을 다른 문서로 이동해야 할 수 있습니다. 이를 위해 PyPDF2 라이브러리를 사용할 것입니다.
PyPDF2 라이브러리 설치
PyPDF2는 Python에서 PDF 파일을 다루기 위한 유용한 라이브러리입니다. 다음 명령으로 PyPDF2를 설치합니다.
pip install PyPDF2
코드 예제
다음은 PDF 파일에서 특정 영역을 추출하여 붙여넣는 예제 코드입니다.
import PyPDF2
def copy_pdf_region(input_pdf, output_pdf, page_number, x1, y1, x2, y2):
with open(input_pdf, 'rb') as file:
pdf_reader = PyPDF2.PdfFileReader(file)
page = pdf_reader.getPage(page_number)
output_pdf_writer = PyPDF2.PdfFileWriter()
output_pdf_writer.addPage(page)
page.cropBox.upperLeft = (x1, y1)
page.cropBox.lowerRight = (x2, y2)
with open(output_pdf, 'wb') as output_file:
output_pdf_writer.write(output_file)
# 사용 예시
copy_pdf_region('input.pdf', 'output.pdf', 0, 100, 100, 300, 300)
위 코드에서 input_pdf
는 원본 PDF 파일의 경로를, output_pdf
는 생성할 결과 파일의 경로를 나타냅니다. page_number
는 추출할 페이지 번호, (x1, y1)
은 추출할 영역의 왼쪽 상단 좌표, (x2, y2)
는 추출할 영역의 오른쪽 하단 좌표를 의미합니다. 이렇게 정의된 영역은 원하는 크기로 조정할 수 있습니다.
참고 자료
위 예제를 참고하여 Python을 사용하여 PDF 파일에서 특정 영역을 추출하고 다른 문서에 붙여넣는 방법을 익히실 수 있습니다. 이를 응용하여 여러분의 프로젝트나 작업에 활용해 보세요!