[python] PyTesseract를 사용하여 연설이나 인터뷰에서 텍스트 자막 추출하기

22 Nov 2023

python

PyTesseract는 이미지에서 텍스트를 추출하는 데 사용되는 Python 라이브러리입니다. 이를 사용하여 연설이나 인터뷰와 같은 비디오에서 텍스트 자막을 추출할 수 있습니다. 이 기능은 텍스트 인식 및 자동 자막 생성과 같은 응용 프로그램에 유용합니다.

필요한 패키지 설치

PyTesseract를 사용하려면 tesseract OCR 엔진과 pytesseract를 설치해야 합니다. 아래의 커맨드를 사용하여 필요한 패키지를 설치할 수 있습니다.

pip install pytesseract
pip install tesseract

이미지에서 텍스트 추출하기

PyTesseract를 사용하여 이미지에서 텍스트를 추출하는 예제를 살펴보겠습니다. 먼저, 이미지 파일을 열고 pytesseract를 사용하여 텍스트를 추출합니다.

import pytesseract
from PIL import Image

# 이미지 파일 열기
image_path = 'path/to/image.png'
image = Image.open(image_path)

# 이미지에서 텍스트 추출
text = pytesseract.image_to_string(image)

# 추출된 텍스트 출력
print(text)

비디오에서 텍스트 자막 추출하기

이미지에서 텍스트를 추출하는 것 외에도, PyTesseract를 사용하여 비디오에서 텍스트 자막을 추출할 수도 있습니다. 이 방법을 통해 연설이나 인터뷰와 같은 비디오에서 자막을 생성할 수 있습니다.

import cv2
import pytesseract
from PIL import Image

# 비디오 파일 열기
video_path = 'path/to/video.mp4'
video_capture = cv2.VideoCapture(video_path)

# 비디오에서 프레임 읽기
while video_capture.isOpened():
    ret, frame = video_capture.read()
    
    if not ret:
        break
    
    # 프레임을 이미지로 변환
    image = Image.fromarray(frame)

    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(image)

    # 추출된 텍스트 출력
    print(text)

# 비디오 캡처 해제
video_capture.release()

요약

PyTesseract는 이미지와 비디오에서 텍스트를 추출하는 강력한 도구입니다. 이를 사용하여 연설이나 인터뷰와 같은 비디오에서 쉽게 자막을 추출하고 활용할 수 있습니다. PyTesseract와 관련된 더 많은 기능과 옵션을 확인하려면 공식 문서를 참조하세요.