[python] 파이썬으로 워드 문서에서 특정 텍스트 찾기
파이썬을 사용하여 MS Word 문서에서 특정 텍스트를 찾는 방법을 알아보겠습니다. 파이썬에서는 python-docx
라이브러리를 사용하여 워드 문서를 조작할 수 있습니다.
패키지 설치
먼저, python-docx
패키지를 설치해야 합니다. 아래 명령어를 사용하여 패키지를 설치할 수 있습니다.
pip install python-docx
코드 작성
다음으로, 아래 코드를 사용하여 워드 문서에서 특정 텍스트를 찾을 수 있습니다.
from docx import Document
def find_text(filename, text):
doc = Document(filename)
for paragraph in doc.paragraphs:
if text in paragraph.text:
print(f"Found '{text}' in: {paragraph.text}")
# 워드 문서 파일 경로
filename = "document.docx"
# 찾을 텍스트
text_to_find = "특정 텍스트"
find_text(filename, text_to_find)
위의 코드는 find_text
함수를 정의하고, 해당 함수를 호출하여 특정 텍스트를 찾습니다. filename
변수에는 워드 문서 파일의 경로를 지정하고, text_to_find
변수에는 찾을 텍스트를 지정합니다.
실행 결과
위의 코드를 실행하면, 워드 문서에서 해당 텍스트가 포함된 모든 단락을 출력합니다. 예를 들어, “특정 텍스트를 찾았습니다”라는 문장이 워드 문서에 포함되어 있다면 아래와 같은 결과가 출력될 것입니다.
Found '특정 텍스트' in: 이 문서에서는 특정 텍스트를 찾을 수 있습니다.