[python] PyTesseract를 사용하여 스크린샷에서 텍스트 추출하기

22 Nov 2023

python

PyTesseract는 OCR(광학 문자 인식) 엔진인 Tesseract를 Python에서 사용하기 쉽게 만든 라이브러리입니다. 이를 이용하여 이미지나 스크린샷에서 텍스트를 추출할 수 있습니다. 이번 포스트에서는 PyTesseract를 사용하여 스크린샷에서 텍스트를 추출하는 방법을 알아보겠습니다.

1. PyTesseract 설치하기

먼저, PyTesseract를 설치해야 합니다. 아래 명령을 사용하여 PyTesseract를 설치할 수 있습니다.

pip install pytesseract

또한, Tesseract OCR 엔진도 설치되어 있어야 합니다. Windows 환경에서는 공식 Tesseract 사이트에서 해당 패키지를 다운로드하여 설치할 수 있습니다. MacOS나 Linux 환경에서는 다음 명령을 사용하여 Tesseract를 설치할 수 있습니다.

sudo apt-get install tesseract-ocr

2. 이미지에서 텍스트 추출하기

이미지에서 텍스트를 추출하기 위해서는 이미지 파일의 경로나 스크린샷 이미지의 PIL(Python Imaging Library) 객체를 PyTesseract에 전달해야합니다. 아래는 스크린샷 이미지에서 텍스트를 추출하는 예제 코드입니다.

import pytesseract
from PIL import Image

# 이미지 파일을 열고 PIL 이미지 객체로 변환
image_path = "screenshot.png"
image = Image.open(image_path)

# PyTesseract를 사용하여 텍스트 추출
text = pytesseract.image_to_string(image)

# 추출한 텍스트 출력
print(text)

위 코드에서 image_path 변수에는 스크린샷 이미지 파일의 경로가 들어가야 합니다. pytesseract.image_to_string 함수를 사용하여 이미지에서 텍스트를 추출하고, print 함수를 사용하여 추출한 텍스트를 출력합니다.

결론

PyTesseract를 사용하면 스크린샷 이미지에서 텍스트를 추출하는 작업을 간단하게 할 수 있습니다. 이를 응용하여 자동화된 텍스트 인식 시스템을 구축하거나, 이미지에서 특정 텍스트를 찾는 등 다양한 작업을 수행할 수 있습니다.