[python] python-pptx PPT 파일 이미지 추출하기

python-pptx는 파이썬에서 PPT 파일을 다루기 위한 라이브러리로, PPT 파일을 생성하고 수정할 수 있는 기능을 제공합니다. 이 라이브러리를 사용하여 PPT 파일에서 이미지를 추출하는 방법에 대해 알아보겠습니다.

필요한 라이브러리 설치

먼저, python-pptx 라이브러리를 설치해야 합니다. 아래 명령어를 사용하여 설치할 수 있습니다.

pip install python-pptx

PPT 파일에서 이미지 추출하기

이제, PPT 파일에서 이미지를 추출하는 방법을 알아보겠습니다. 아래 코드는 PPT 파일에서 이미지를 추출하고 이미지 파일로 저장하는 예제입니다.

from pptx import Presentation

def extract_images_from_ppt(filename):
    prs = Presentation(filename)

    for slide in prs.slides:
        for shape in slide.shapes:
            if shape.shape_type == 13:  # 이미지 타입인 경우
                image = shape.image
                image_bytes = image.blob
                image_filename = shape.name + ".png"
                with open(image_filename, 'wb') as f:
                    f.write(image_bytes)
                print(f"이미지 {image_filename} 추출 완료")

# PPT 파일 경로 설정
ppt_file = "example.pptx"

# 이미지 추출 실행
extract_images_from_ppt(ppt_file)

위의 코드에서 ppt_file 변수에 원하는 PPT 파일의 경로를 설정하고, extract_images_from_ppt 함수를 호출하면 해당 PPT 파일에서 이미지가 추출됩니다. 추출된 이미지는 .png 포맷으로 현재 디렉토리에 저장됩니다.

결론

이상으로 python-pptx 라이브러리를 사용하여 PPT 파일에서 이미지를 추출하는 방법에 대해 알아보았습니다. 이를 응용하여 PPT 파일에서 필요한 이미지를 추출하고 활용할 수 있을 것입니다.

참고자료