[python] PyTesseract를 사용하여 레시피에서 텍스트 추출하기

22 Nov 2023

python

이번 블로그 포스트에서는 PyTesseract를 사용하여 레시피 이미지에서 텍스트를 추출하는 방법에 대해 알아보겠습니다. PyTesseract은 OCR(광학 문자 인식) 엔진인 Tesseract의 파이썬 인터페이스입니다. 이를 통해 이미지에서 문자를 인식하고 추출할 수 있습니다.

1. PyTesseract 설치하기

먼저, PyTesseract를 설치해야 합니다. 아래의 명령어를 사용하여 설치할 수 있습니다.

pip install pytesseract

또한, OCR을 수행하기 위해서는 Tesseract OCR 엔진이 필요합니다. Tesseract는 다양한 운영체제에서 사용할 수 있으며, 해당 운영체제에 맞는 Tesseract를 설치해야 합니다. 자세한 설치 방법은 공식 GitHub 저장소를 참조하시기 바랍니다.

2. 이미지에서 텍스트 추출하기

이제 PyTesseract를 사용하여 이미지에서 텍스트를 추출해보겠습니다. 먼저, 이미지 파일을 읽어들이는 방법은 다음과 같습니다.

import pytesseract
from PIL import Image

image_path = "recipe_image.jpg"  # 추출할 이미지 파일 경로
image = Image.open(image_path)  # 이미지 열기

이미지를 성공적으로 읽어들였다면, pytesseract.image_to_string 함수를 사용하여 텍스트 추출을 수행할 수 있습니다.

extracted_text = pytesseract.image_to_string(image)
print(extracted_text)

위의 코드를 실행하면, 레시피 이미지에서 추출된 텍스트를 콘솔에 출력할 수 있습니다.

3. 추가 설정 및 파라미터

PyTesseract는 기본적으로 영어를 인식하는 데 최적화되어 있지만, 다른 언어도 인식할 수 있도록 설정할 수 있습니다. tesseract_cmd 파라미터를 사용하여 Tesseract의 경로를 지정하고, lang 파라미터를 사용하여 인식할 언어를 지정할 수 있습니다.

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"  # Tesseract의 경로 설정
extracted_text = pytesseract.image_to_string(image, lang="kor")  # 한국어 인식 설정

또한, 이미지의 크기 및 해상도에 따라 인식의 정확도가 달라질 수 있습니다. 이를 해결하기 위해 이미지 전처리 기술을 사용하여 이미지의 품질을 향상시킬 수 있습니다. 예를 들면, 이미지를 흑백으로 변환하거나, 스케일링을 적용하는 등의 작업을 할 수 있습니다.

마치며

이번 포스트에서는 PyTesseract를 사용하여 레시피 이미지에서 텍스트를 추출하는 방법을 알아보았습니다. PyTesseract를 활용하면 다양한 이미지에서 텍스트를 추출하여 자동화된 프로세스에 적용할 수 있습니다. OCR 기술은 다양한 분야에서 활용되며, 더 많은 기능과 설정을 사용하고 싶다면 PyTesseract의 공식 문서를 참조하시기 바랍니다.