[python] PyTesseract를 사용하여 음식 포장상자에서 텍스트 추출하기

22 Nov 2023

python

이번 포스트에서는 PyTesseract를 사용하여 음식 포장상자에서 텍스트를 추출하는 방법에 대해 알아보겠습니다.

PyTesseract란?

PyTesseract는 Google의 OCR 엔진인 Tesseract를 Python에서 간편하게 사용할 수 있도록 구현한 라이브러리입니다. 이를 이용하면 이미지나 스캔한 문서 등에서 텍스트를 추출할 수 있습니다.

PyTesseract 설치하기

먼저, PyTesseract를 설치해야합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install pytesseract

또한, Tesseract OCR 엔진 역시 설치되어 있어야 합니다. 설치 방법은 각 운영체제별로 다르기 때문에 구글링을 통해 찾아보시길 권장드립니다.

음식 포장상자에서 텍스트 추출하기

이제 PyTesseract를 사용하여 음식 포장상자에서 텍스트를 추출하는 예제 코드를 살펴보겠습니다.

import cv2
import pytesseract

# 이미지 파일 읽기
image = cv2.imread('food_packaging.jpg')

# 이미지를 흑백으로 변환
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 이미지 전처리
gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

# 텍스트 추출
text = pytesseract.image_to_string(gray, lang='eng')

# 결과 출력
print(text)

위 코드에서는 cv2 모듈을 사용하여 이미지 파일을 읽고, pytesseract를 사용하여 텍스트를 추출합니다. 이미지를 흑백으로 변환한 후에는 이미지 전처리를 위해 이진화 작업을 수행합니다. 그리고 image_to_string 메서드를 이용하여 텍스트를 추출한 뒤 결과를 출력합니다.

결과 확인

위의 코드를 실행하면 음식 포장상자의 텍스트가 터미널에 출력됩니다. 만약 텍스트 추출이 제대로 이루어지지 않는다면 이미지 전처리 과정을 조정하거나 Tesseract OCR 엔진을 업데이트 해보시기 바랍니다.

결론

이번 포스트에서는 PyTesseract를 사용하여 음식 포장상자에서 텍스트를 추출하는 방법을 알아보았습니다. 텍스트 추출을 통해 자동화 작업이나 데이터 분석 등 다양한 용도로 활용할 수 있습니다. PyTesseract의 다양한 기능과 옵션에 대해서도 더 알아보시기를 추천드립니다.