[python] PDF 파일에서 특정 영역 크롭하기
소개
PDF 파일은 다양한 정보를 포함하고 있으며, 때로는 특정 페이지나 영역을 추출하고 싶을 수 있습니다. 이번 블로그에서는 Python의 PyPDF2
라이브러리를 사용하여 PDF 파일에서 특정 영역을 크롭하는 방법을 알아보겠습니다.
라이브러리 설치
먼저, PyPDF2
라이브러리를 설치해야 합니다. 아래의 명령을 사용하여 설치할 수 있습니다:
pip install PyPDF2
PDF 파일에서 영역 크롭하기
다음은 PDF 파일에서 특정 영역을 크롭하는 Python 코드의 예시입니다:
import PyPDF2
def crop_pdf(input_path, output_path, x1, y1, x2, y2):
# 입력 PDF 파일 열기
with open(input_path, 'rb') as file:
pdf = PyPDF2.PdfFileReader(file)
# 크롭할 페이지 선택
page = pdf.getPage(0)
# 페이지 영역 설정
page.cropBox.lowerLeft = (x1, y1)
page.cropBox.upperRight = (x2, y2)
# 크롭된 페이지를 새로운 PDF 파일로 저장
output_pdf = PyPDF2.PdfFileWriter()
output_pdf.addPage(page)
with open(output_path, 'wb') as output_file:
output_pdf.write(output_file)
# 사용 예시
input_path = 'example.pdf' # 입력 PDF 파일 경로
output_path = 'cropped.pdf' # 출력 파일 경로
x1, y1, x2, y2 = 100, 200, 400, 600 # 크롭할 영역 좌표
crop_pdf(input_path, output_path, x1, y1, x2, y2)
위의 예시 코드에서 crop_pdf
함수는 입력 PDF 파일에서 x1, y1
에서 x2, y2
로 지정된 영역을 크롭합니다. 코드를 실행하면 cropped.pdf
라는 이름의 새로운 PDF 파일이 생성됩니다.
결론
이 블로그에서는 Python의 PyPDF2
라이브러리를 사용하여 PDF 파일에서 특정 영역을 크롭하는 방법을 알아보았습니다. 이를 통해 필요한 정보를 추출하거나, 원하는 페이지만 추출하여 작업할 수 있습니다.