[python] OpenCV를 사용하여 이미지에서 문자 인식하기

22 Nov 2023

python

이미지 처리를 위한 강력한 라이브러리인 OpenCV를 사용하면 이미지에서 문자를 인식하는 작업을 쉽게 수행할 수 있습니다. 이 글에서는 Python의 OpenCV를 사용하여 이미지에서 문자를 인식하는 간단한 예제 코드를 제공하겠습니다.

1. 필요한 패키지 설치하기

먼저, 필요한 패키지를 설치해야 합니다. 아래의 명령어를 사용하여 OpenCV와 pytesseract 패키지를 설치할 수 있습니다.

pip install opencv-python
pip install pytesseract

2. 이미지에서 문자 인식하기

import cv2
import pytesseract

# 이미지 읽기
img = cv2.imread("image.jpg")

# 이미지를 흑백으로 변환
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 이미지에서 문자 인식
text = pytesseract.image_to_string(gray)

# 결과 출력
print(text)

위의 코드에서는 cv2.imread() 함수를 사용하여 이미지를 읽고, cv2.cvtColor() 함수를 사용하여 이미지를 흑백으로 변환합니다. 그리고 pytesseract.image_to_string() 함수를 사용하여 이미지에서 문자를 인식합니다. 마지막으로, 결과를 출력합니다.

이제 위의 코드를 실행하면 이미지에서 인식된 문자를 확인할 수 있습니다.

3. 추가 설정

만약, pytesseract 패키지가 이미 설치되어 있다면, OCR 엔진을 추가로 설치해야 합니다. OCR 엔진은 문자 인식을 위해 필요한 도구로, Tesseract-OCR 엔진을 사용하면 됩니다. Tesseract-OCR 엔진은 오픈 소스로 제공되며, 자세한 설치 방법은 여기에서 확인할 수 있습니다.

Tesseract-OCR 엔진을 설치한 후에는 pytesseract.pytesseract.tesseract_cmd 변수를 사용하여 Tesseract-OCR 엔진의 실행 파일 경로를 지정해야 합니다. 예를 들어, Windows 환경에서 Tesseract-OCR 엔진을 설치한 경우, 아래와 같이 설정할 수 있습니다.

import pytesseract

# Tesseract-OCR 엔진의 실행 파일 경로 설정
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files/Tesseract-OCR/tesseract.exe'

이렇게 설정한 후에는 위의 예제 코드를 실행하여 이미지에서 문자를 인식할 수 있습니다.

마무리

이번 글에서는 OpenCV를 사용하여 이미지에서 문자를 인식하는 방법을 알아보았습니다. 이미지 처리를 위한 다양한 기능을 제공하는 OpenCV와 문자 인식을 가능하게 해주는 pytesseract 패키지는 데이터 처리나 컴퓨터 비전 작업에 유용하게 사용될 수 있습니다.