[python] PDF 파일에서 이미지 유형 화면 캡처하기

Python을 사용하여 PDF 파일에서 이미지 유형 화면을 캡처하는 방법을 알아보겠습니다. 이 기능을 구현하기 위해서는 pdf2image 라이브러리를 사용합니다.

1. pdf2image 설치하기

아래 명령어를 사용하여 pdf2image를 설치합니다.

pip install pdf2image

2. 코드 작성하기

from pdf2image import convert_from_path

def extract_images_from_pdf(pdf_path):
    images = convert_from_path(pdf_path)
    
    for i, image in enumerate(images):
        image_path = "image{}.png".format(i + 1)
        image.save(image_path, "PNG")
        print("이미지 {} 저장 완료".format(i + 1))

# PDF 파일 경로 설정
pdf_path = "<pdf 파일 경로>"

# 이미지 추출 함수 호출
extract_images_from_pdf(pdf_path)

위 코드에서는 pdf_path 변수에 추출하고자 하는 PDF 파일의 경로를 설정합니다. 그리고 extract_images_from_pdf 함수를 호출하여 PDF 파일에서 이미지를 추출합니다. 추출된 이미지는 PNG 형식으로 현재 디렉토리에 image1.png, image2.png, … 와 같이 순서대로 저장됩니다.

3. 실행하기

위 코드를 작성한 후, 해당 파일을 실행하면 pdf_path에 입력한 PDF 파일에서 이미지를 추출하여 저장하게 됩니다. 이미지는 현재 디렉토리에 저장되며, 파일명은 순서에 따라 image1.png, image2.png, … 와 같이 설정됩니다.

이제 Python을 사용하여 PDF 파일에서 이미지 유형 화면을 캡처할 수 있습니다!

참고 자료