[python] 파이썬 pyautogui를 사용하여 이미지 텍스트 추출하기

이미지에 포함된 텍스트를 추출하려면 OCR(광학 문자 인식) 기술을 사용해야합니다. 이를 위해 pyautogui 라이브러리와 함께 pytesseract 라이브러리를 사용하는 것이 일반적입니다.

1. 필수 요구사항 설치하기

먼저, pytesseract 라이브러리와 OCR 엔진을 설치해야합니다. 아래의 명령어를 실행하여 필수 요구사항을 설치할 수 있습니다.

pip install pytesseract

그리고 Tesseract OCR을 설치해주어야합니다. 아래 링크를 통해 Tesseract OCR을 다운로드하고 설치할 수 있습니다.

2. 이미지 텍스트 추출하기

이제 pyautogui 라이브러리와 pytesseract 라이브러리를 사용하여 이미지에서 텍스트를 추출하는 방법을 알아보겠습니다.

import pyautogui
import pytesseract

# 이미지 파일을 로드합니다.
image = pyautogui.screenshot('image.png')

# 이미지 파일에서 텍스트를 추출합니다.
text = pytesseract.image_to_string(image)

# 추출된 텍스트를 출력합니다.
print(text)

위의 코드를 실행하면 스크린샷이 찍힌 후, 해당 이미지에서 추출된 텍스트가 출력됩니다.

3. 이미지 영역 설정하기

만약 이미지에 텍스트가 포함되어 있는 특정 영역을 추출하고 싶다면, pyautogui 라이브러리의 좌표 기능을 사용하여 영역을 설정할 수 있습니다.

import pyautogui
import pytesseract

# 이미지 파일을 로드합니다.
image = pyautogui.screenshot('image.png')

# 추출할 영역의 좌표를 설정합니다.
# (x, y, width, height)
region = (100, 100, 300, 200)

# 이미지 파일에서 지정한 영역의 텍스트를 추출합니다.
text = pytesseract.image_to_string(image.crop(region))

# 추출된 텍스트를 출력합니다.
print(text)

위의 코드는 이미지 파일에서 (100, 100, 300, 200) 좌표에 해당하는 영역의 텍스트를 추출하는 예제입니다.

참고 자료