[python] PDF 파일에서 특정 영역 크롭하기

소개

PDF 파일은 다양한 정보를 포함하고 있으며, 때로는 특정 페이지나 영역을 추출하고 싶을 수 있습니다. 이번 블로그에서는 Python의 PyPDF2 라이브러리를 사용하여 PDF 파일에서 특정 영역을 크롭하는 방법을 알아보겠습니다.

라이브러리 설치

먼저, PyPDF2 라이브러리를 설치해야 합니다. 아래의 명령을 사용하여 설치할 수 있습니다:

pip install PyPDF2

PDF 파일에서 영역 크롭하기

다음은 PDF 파일에서 특정 영역을 크롭하는 Python 코드의 예시입니다:

import PyPDF2

def crop_pdf(input_path, output_path, x1, y1, x2, y2):
    # 입력 PDF 파일 열기
    with open(input_path, 'rb') as file:
        pdf = PyPDF2.PdfFileReader(file)

        # 크롭할 페이지 선택
        page = pdf.getPage(0)

        # 페이지 영역 설정
        page.cropBox.lowerLeft = (x1, y1)
        page.cropBox.upperRight = (x2, y2)

        # 크롭된 페이지를 새로운 PDF 파일로 저장
        output_pdf = PyPDF2.PdfFileWriter()
        output_pdf.addPage(page)

        with open(output_path, 'wb') as output_file:
            output_pdf.write(output_file)

# 사용 예시
input_path = 'example.pdf'  # 입력 PDF 파일 경로
output_path = 'cropped.pdf'  # 출력 파일 경로
x1, y1, x2, y2 = 100, 200, 400, 600  # 크롭할 영역 좌표
crop_pdf(input_path, output_path, x1, y1, x2, y2)

위의 예시 코드에서 crop_pdf 함수는 입력 PDF 파일에서 x1, y1에서 x2, y2로 지정된 영역을 크롭합니다. 코드를 실행하면 cropped.pdf라는 이름의 새로운 PDF 파일이 생성됩니다.

결론

이 블로그에서는 Python의 PyPDF2 라이브러리를 사용하여 PDF 파일에서 특정 영역을 크롭하는 방법을 알아보았습니다. 이를 통해 필요한 정보를 추출하거나, 원하는 페이지만 추출하여 작업할 수 있습니다.