[python] 파이썬으로 워드 문서 이미지 크롭하기

이번에는 파이썬을 사용하여 워드 문서에서 이미지를 자르는 방법을 알아보겠습니다. 워드 문서에서 이미지를 자르는 것은 일반적으로 다양한 용도로 사용되며, 특히 OCR(Optical Character Recognition) 등의 작업을 수행할 때 유용합니다.

필요한 라이브러리 설치

먼저, 파이썬에서 워드 문서를 다루기 위해 python-docx 라이브러리를 설치해야 합니다. 아래의 명령을 사용하여 설치할 수 있습니다.

pip install python-docx

이제 필요한 라이브러리가 설치되었으니, 이제 코드를 작성해보겠습니다.

코드 작성

먼저, python-docx 라이브러리를 임포트합니다.

import docx

다음으로, 워드 문서를 열고 이미지를 자르는 함수를 정의합니다.

def crop_image(document_path, image_index, x, y, width, height):
    doc = docx.Document(document_path)
    image = doc.inline_shapes[image_index].inline_graphic.graphic.graphicData.pic.blipFill.blip
    image.crop_left = x
    image.crop_top = y
    image.crop_right = image.width - width
    image.crop_bottom = image.height - height
    doc.save(document_path)

위의 코드에서 document_path는 워드 문서의 경로를 나타내고, image_index는 이미지의 인덱스를 나타냅니다. 이미지의 인덱스는 0부터 시작합니다. x, y, width, height는 자를 부분을 지정하기 위한 값들입니다.

코드 사용 예시

이제 위에서 작성한 함수를 사용해보겠습니다. 아래의 예시에서는 document.docx 파일의 첫 번째 이미지를 (10, 10) 좌표에서 100픽셀만큼 자르는 예시입니다.

document_path = "document.docx"
image_index = 0
x = 10
y = 10
width = 100
height = 100

crop_image(document_path, image_index, x, y, width, height)

위의 코드를 실행하면 document.docx 파일의 첫 번째 이미지가 자르기된 결과를 얻을 수 있습니다.

마무리

파이썬을 사용하여 워드 문서의 이미지를 자르는 방법에 대해 알아보았습니다. 이를 응용하여 다양한 작업을 수행할 수 있으며, 필요에 따라 자신에게 맞게 코드를 수정하여 사용할 수 있습니다. 자세한 내용은 python-docx 라이브러리 문서를 참조하세요.