[python] 파이썬으로 워드 문서 열기

파이썬은 다양한 파일 형식을 다룰 수 있는 강력한 프로그래밍 언어입니다. 이 중에서도 워드 문서는 많은 사람들이 사용하는 파일 형식 중 하나입니다. 이번 포스트에서는 파이썬을 사용하여 워드 문서를 열고 데이터를 읽는 방법에 대해 알아보겠습니다.

1. python-docx 라이브러리 설치하기

파이썬에서 워드 문서를 다루기 위해서는 python-docx라이브러리를 설치해야 합니다.

pip install python-docx

2. 워드 문서 열기

python-docx 라이브러리를 사용하여 워드 문서를 열기 위해서는 Document클래스를 사용해야 합니다. 아래는 워드 문서를 열고, 문단별로 텍스트를 출력하는 코드입니다.

from docx import Document

# 워드 문서 열기
doc = Document('example.docx')

# 문단별로 텍스트 출력
for paragraph in doc.paragraphs:
    print(paragraph.text)

위의 코드에서 Document('example.docx')를 사용하여 example.docx 파일을 열고, paragraphs 속성을 사용하여 문서의 모든 문단을 가져올 수 있습니다. 문단은 paragraphs 속성을 반복문으로 순회하면서 text 속성으로 텍스트를 가져올 수 있습니다.

3. 결과 확인하기

위의 코드를 실행하면 워드 문서의 모든 문단이 순서대로 출력됩니다. 워드 문서에 있는 텍스트 데이터를 파이썬에서 활용할 수 있게 되었습니다.

4. 추가 기능

python-docx 라이브러리는 워드 문서를 열고 수정하는 다양한 기능을 제공합니다. 예를 들어, 새로운 문단을 추가하거나 특정 문단의 텍스트를 변경하는 등의 작업이 가능합니다. 더 자세한 내용은 python-docx 라이브러리의 문서를 참고하시기 바랍니다.

참고 자료