[python] PyTesseract를 사용하여 동영상에서 텍스트 추출하기

22 Nov 2023

python

이번 포스트에서는 PyTesseract라는 Python 라이브러리를 사용하여 동영상에서 텍스트를 추출하는 방법에 대해 알아보겠습니다.

PyTesseract란?

PyTesseract는 OCR(광학 문자 인식) 엔진인 Tesseract를 Python에서 사용할 수 있도록 만든 인터페이스입니다. Tesseract는 이미지나 동영상에서 문자를 인식하는데 사용되며, 이미지나 동영상에서 텍스트를 추출할 때 매우 유용합니다.

PyTesseract 설치

PyTesseract를 사용하기 위해서는 우선 Tesseract OCR 엔진을 설치해야합니다. 각 운영체제에 맞는 설치 방법은 공식 Tesseract GitHub 페이지에서 확인할 수 있습니다.

다음으로, PyTesseract를 설치하기 위해 다음 명령을 실행하세요:

pip install pytesseract

동영상에서 텍스트 추출하기

이제 PyTesseract를 사용하여 동영상에서 텍스트를 추출하는 방법을 살펴보겠습니다. 우리는 OpenCV라는 Python 라이브러리를 사용하여 동영상을 처리하고, PyTesseract를 사용하여 텍스트를 추출할 것입니다.

먼저, 필요한 라이브러리를 import 합니다:

import cv2
import pytesseract

다음으로, 동영상 파일을 열고 프레임을 읽어들입니다:

video = cv2.VideoCapture('video.mp4')

while video.isOpened():
    ret, frame = video.read()
    if not ret:
        break
        
    # 프레임 처리 코드

프레임을 처리하기 전에, Tesseract에 입력으로 사용할 이미지로 변환해야합니다. OpenCV에서는 이미지를 흑백 이미지로 변환하는 cv2.cvtColor() 함수를 제공합니다. 다음 코드와 같이 프레임을 흑백 이미지로 변환할 수 있습니다:

gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

이제 변환한 이미지를 PyTesseract를 사용하여 텍스트를 추출할 수 있습니다. pytesseract.image_to_string() 함수를 사용하여 이미지에서 텍스트를 추출할 수 있습니다:

text = pytesseract.image_to_string(gray)

마지막으로, 추출한 텍스트를 출력하거나 파일로 저장할 수 있습니다:

print(text)

이제 동영상에서 텍스트를 추출하는 코드를 완성했습니다. 전체 코드는 다음과 같습니다:

import cv2
import pytesseract

video = cv2.VideoCapture('video.mp4')

while video.isOpened():
    ret, frame = video.read()
    if not ret:
        break
        
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    text = pytesseract.image_to_string(gray)
    print(text)

결론

이번 포스트에서는 PyTesseract를 사용하여 동영상에서 텍스트를 추출하는 방법을 알아보았습니다. PyTesseract는 강력한 OCR 엔진으로 동영상, 이미지 등에서 텍스트를 추출하는데 유용합니다. 이를 통해 자동화나 데이터 처리 작업에 활용할 수 있습니다.