[python] PDF 파일에서 이미지 유형 스캔하기

30 Nov 2023

python

이번 포스트에서는 Python을 사용하여 PDF 파일에서 이미지 유형을 스캔하는 방법에 대해 알아보겠습니다. 우리는 ‘pdf2image’ 라이브러리를 사용하여 이 작업을 수행할 것입니다.

1. pdf2image 라이브러리 설치하기

먼저, ‘pdf2image’ 라이브러리를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install pdf2image

2. PDF 파일에서 이미지 유형 스캔하기

다음으로, 아래의 코드를 사용하여 PDF 파일에서 이미지 유형을 스캔할 수 있습니다.

from pdf2image import convert_from_path

def scan_images_from_pdf(pdf_file):
    # PDF 파일에서 이미지 스캔하기
    images = convert_from_path(pdf_file)

    for i, image in enumerate(images):
        # 이미지 유형 스캔하기
        image_type = image.format

        print(f"Image {i+1} Type: {image_type}")

# PDF 파일 경로
pdf_file = "example.pdf"

# PDF 파일에서 이미지 유형 스캔하기
scan_images_from_pdf(pdf_file)

위의 코드에서 함수 scan_images_from_pdf 는 주어진 PDF 파일에서 이미지를 스캔하는데 사용됩니다. 각 이미지는 이미지 유형(format)으로 식별됩니다.

3. 실행 결과

위의 코드를 실행하면 PDF 파일에서 추출된 각 이미지의 유형을 출력할 수 있습니다.

Image 1 Type: JPEG
Image 2 Type: PNG
Image 3 Type: JPEG

마무리

이제 Python을 사용하여 PDF 파일에서 이미지 유형을 스캔하는 방법을 알게 되었습니다. ‘pdf2image’ 라이브러리를 사용하면 손쉽게 이 작업을 수행할 수 있으며, 추출된 이미지의 유형을 활용하여 필요한 작업을 수행할 수 있습니다.

참고 자료

pdf2image GitHub 페이지