[python] PDF 파일에서 이미지 유형 붙여넣기

PDF 파일에서 이미지를 추출하여 다른 이미지 유형으로 변환하고 싶다면, Python이 좋은 도구가 될 수 있습니다.

필요한 라이브러리 설치하기

먼저, pdf2image 라이브러리를 설치해야 합니다. 이 라이브러리는 PDF 파일에서 이미지를 추출하는 기능을 제공합니다. 다음 명령을 사용하여 라이브러리를 설치하세요:

pip install pdf2image

그 후, 이미지를 다른 형식으로 변환하기 위해 Pillow 라이브러리를 설치해야 합니다:

pip install Pillow

PDF 파일에서 이미지 추출하기

다음은 pdf2image 라이브러리를 사용하여 PDF 파일에서 이미지를 추출하는 예제 코드입니다:

from pdf2image import convert_from_path

# PDF 파일 경로 설정
pdf_path = 'example.pdf'

# 이미지 추출
images = convert_from_path(pdf_path)

# 이미지 파일 저장
for i, image in enumerate(images):
    image.save(f'output_{i}.jpg', 'JPEG')

위 코드를 실행하면, example.pdf에서 추출된 이미지 파일들이 output_0.jpg, output_1.jpg, … 등의 이름으로 저장됩니다.

이미지 유형 변경하기

이미지 유형을 변경하려면, Pillow 라이브러리를 사용하여 이미지 파일을 열고 다른 형식으로 저장합니다. 예를 들어, JPEG에서 PNG로 변환하고 싶다면 다음과 같이 코드를 수정합니다:

from PIL import Image

# 이미지 유형 변경
for i in range(len(images)):
    image_path = f'output_{i}.jpg'
    image = Image.open(image_path)
    image.save(f'output_{i}.png', 'PNG')

위 코드는 output_0.jpg, output_1.jpg, … 등의 이미지를 PNG 형식으로 변경하여 output_0.png, output_1.png, … 등의 파일로 저장합니다.

결론

Python을 사용하여 PDF 파일에서 이미지를 추출한 후 다른 이미지 유형으로 변환하는 방법을 살펴보았습니다. pdf2imagePillow 라이브러리를 활용하면 더 다양한 이미지 관련 작업을 수행할 수 있습니다.

참고 자료