[python] 파이썬으로 워드 문서에서 특정 텍스트 찾기

파이썬을 사용하여 MS Word 문서에서 특정 텍스트를 찾는 방법을 알아보겠습니다. 파이썬에서는 python-docx 라이브러리를 사용하여 워드 문서를 조작할 수 있습니다.

패키지 설치

먼저, python-docx 패키지를 설치해야 합니다. 아래 명령어를 사용하여 패키지를 설치할 수 있습니다.

pip install python-docx

코드 작성

다음으로, 아래 코드를 사용하여 워드 문서에서 특정 텍스트를 찾을 수 있습니다.

from docx import Document

def find_text(filename, text):
    doc = Document(filename)
    for paragraph in doc.paragraphs:
        if text in paragraph.text:
            print(f"Found '{text}' in: {paragraph.text}")

# 워드 문서 파일 경로
filename = "document.docx"

# 찾을 텍스트
text_to_find = "특정 텍스트"

find_text(filename, text_to_find)

위의 코드는 find_text 함수를 정의하고, 해당 함수를 호출하여 특정 텍스트를 찾습니다. filename 변수에는 워드 문서 파일의 경로를 지정하고, text_to_find 변수에는 찾을 텍스트를 지정합니다.

실행 결과

위의 코드를 실행하면, 워드 문서에서 해당 텍스트가 포함된 모든 단락을 출력합니다. 예를 들어, “특정 텍스트를 찾았습니다”라는 문장이 워드 문서에 포함되어 있다면 아래와 같은 결과가 출력될 것입니다.

Found '특정 텍스트' in: 이 문서에서는 특정 텍스트를 찾을 수 있습니다.

참고 자료