[python] PDF 파일에서 이미지 유형 화면 캡처하기
Python을 사용하여 PDF 파일에서 이미지 유형 화면을 캡처하는 방법을 알아보겠습니다. 이 기능을 구현하기 위해서는 pdf2image
라이브러리를 사용합니다.
1. pdf2image 설치하기
아래 명령어를 사용하여 pdf2image
를 설치합니다.
pip install pdf2image
2. 코드 작성하기
from pdf2image import convert_from_path
def extract_images_from_pdf(pdf_path):
images = convert_from_path(pdf_path)
for i, image in enumerate(images):
image_path = "image{}.png".format(i + 1)
image.save(image_path, "PNG")
print("이미지 {} 저장 완료".format(i + 1))
# PDF 파일 경로 설정
pdf_path = "<pdf 파일 경로>"
# 이미지 추출 함수 호출
extract_images_from_pdf(pdf_path)
위 코드에서는 pdf_path
변수에 추출하고자 하는 PDF 파일의 경로를 설정합니다. 그리고 extract_images_from_pdf
함수를 호출하여 PDF 파일에서 이미지를 추출합니다. 추출된 이미지는 PNG 형식으로 현재 디렉토리에 image1.png
, image2.png
, … 와 같이 순서대로 저장됩니다.
3. 실행하기
위 코드를 작성한 후, 해당 파일을 실행하면 pdf_path
에 입력한 PDF 파일에서 이미지를 추출하여 저장하게 됩니다. 이미지는 현재 디렉토리에 저장되며, 파일명은 순서에 따라 image1.png
, image2.png
, … 와 같이 설정됩니다.
이제 Python을 사용하여 PDF 파일에서 이미지 유형 화면을 캡처할 수 있습니다!