[python] PyTesseract를 사용하여 교통 표지판에서 텍스트 추출하기

22 Nov 2023

python

이번 포스트에서는 PyTesseract를 사용하여 교통 표지판에서 텍스트를 추출하는 방법에 대해 알아보겠습니다. PyTesseract는 Tesseract OCR 엔진의 Python 래퍼로, 이미지에서 텍스트를 추출하는 데 사용됩니다.

PyTesseract 설치

PyTesseract를 사용하기 위해 먼저 Tesseract OCR 엔진을 설치해야 합니다. 운영 체제에 따라 다양한 설치 방법이 있지만, 대부분의 경우 다음과 같이 설치할 수 있습니다.

Windows:

$ pip install pytesseract

macOS:

$ brew install tesseract
$ pip install pytesseract

Linux (Ubuntu):

$ sudo apt-get install tesseract-ocr
$ pip install pytesseract

교통 표지판 이미지에서 텍스트 추출하기

이제 PyTesseract를 사용하여 교통 표지판 이미지에서 텍스트를 추출하는 예제 코드를 작성해보겠습니다.

import pytesseract
from PIL import Image

# 교통 표지판 이미지 불러오기
image = Image.open('traffic_sign.jpg')

# 이미지에서 텍스트 추출하기
text = pytesseract.image_to_string(image, lang='eng')

# 추출된 텍스트 출력하기
print(text)

위 코드에서는 pytesseract.image_to_string() 함수를 사용하여 이미지에서 텍스트를 추출합니다. lang 매개변수를 통해 추출할 언어를 설정할 수 있습니다. 위 예제에서는 영어로 설정했습니다.

결론

이상으로 PyTesseract를 사용하여 교통 표지판에서 텍스트를 추출하는 방법을 알아보았습니다. PyTesseract는 강력한 OCR 엔진이므로 다양한 이미지에서 텍스트를 추출하는 데 유용하게 활용할 수 있습니다.

PyTesseract 설치

교통 표지판 이미지에서 텍스트 추출하기

결론

참고 자료