[python] PyTesseract를 사용하여 가로채기된 메모에서 텍스트 추출하기

22 Nov 2023

이번 글에서는 PyTesseract를 사용하여 가로채기된 이미지에서 텍스트를 추출하는 방법에 대해 알아보겠습니다.

PyTesseract이란?

PyTesseract는 Python에서 Tesseract OCR(광학 문자 인식) 엔진을 사용할 수 있게 해주는 라이브러리입니다. 이를 통해 이미지나 스캔된 문서 등에서 텍스트를 추출할 수 있습니다.

먼저 PyTesseract를 사용하기 위해 Tesseract OCR 엔진을 설치해야 합니다.

!pip install pytesseract

또한, 이미지 처리를 위해 PIL(Python Imaging Library) 라이브러리도 설치해야 합니다.

!pip install pillow

우선 필요한 라이브러리를 import합니다.

from PIL import Image
import pytesseract

다음으로, 이미지를 로드합니다.

image = Image.open('memo.png')

다음으로, 가로채기된 이미지를 세로로 회전시킵니다. 이는 Tesseract OCR의 작동을 최적화하기 위해 필요한 단계입니다.

image = image.rotate(90, expand=True)

이제 PyTesseract를 사용하여 이미지에서 텍스트를 추출합니다.

text = pytesseract.image_to_string(image, lang='eng')

추출된 텍스트를 출력합니다.

print(text)

이렇게 PyTesseract를 사용하여 가로채기된 메모에서 텍스트를 추출하는 방법을 알아보았습니다. 이를 활용하면 스캔되거나 이미지로 저장된 문서의 텍스트를 간편하게 추출할 수 있습니다.