파이썬과 OpenCV를 사용하여 이미지에서 텍스트 영역 추출하기

17 Oct 2023

python

이미지 처리에서 텍스트 영역을 추출하는 것은 많은 응용 프로그램과 프로젝트에 매우 유용합니다. 파이썬과 OpenCV를 사용하면 이미지에서 텍스트 영역을 추출하는 간단하고 효과적인 방법을 구현할 수 있습니다. 이번 튜토리얼에서는 이미지에서 텍스트 영역을 추출하는 방법을 알아보겠습니다.

필요한 라이브러리 설치

이미지 처리를 위해 파이썬의 OpenCV 라이브러리를 설치해야 합니다. 터미널에서 다음 명령을 실행하여 OpenCV를 설치합니다:

pip install opencv-python

이미지에서 텍스트 영역 추출하기

다음은 이미지에서 텍스트 영역을 추출하는 단계별 코드입니다. 아래 코드를 참고하여 진행해 주세요:

import cv2

def extract_text_regions(image_path):
    # 이미지 로드
    image = cv2.imread(image_path)
    
    # 그레이스케일로 변환
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    
    # 이미지 이진화
    _, threshold = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
    
    # 텍스트 영역 추출
    contours, _ = cv2.findContours(threshold, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)
    
    # 추출된 텍스트 영역을 담을 리스트 초기화
    text_regions = []
    
    # 추출된 각 영역에 대해서 반복
    for contour in contours:
        # 영역의 경계 상자 좌표를 구함
        x, y, w, h = cv2.boundingRect(contour)
        
        # 이미지에서 해당 영역을 자르고 리스트에 추가
        text_regions.append(image[y:y+h, x:x+w])
    
    return text_regions

# 이미지 경로 지정
image_path = "example_image.jpg"

# 텍스트 영역 추출
text_regions = extract_text_regions(image_path)

# 추출된 텍스트 영역을 파일로 저장
for i, region in enumerate(text_regions):
    cv2.imwrite(f"text_region_{i}.jpg", region)

위의 코드는 다음과 같은 절차를 따릅니다:

이미지를 로드합니다.
로드한 이미지를 그레이스케일로 변환합니다.
이진화를 통해 이미지를 처리합니다.
텍스트 영역을 추출합니다.
추출된 텍스트 영역을 파일로 저장합니다.

결론

이번 튜토리얼에서는 파이썬과 OpenCV를 사용하여 이미지에서 텍스트 영역을 추출하는 방법을 알아보았습니다. 텍스트 영역 추출은 OCR(Optical Character Recognition) 작업과 같은 다양한 응용 프로그램에 사용될 수 있으며, 파이썬과 OpenCV의 강력한 기능을 활용하여 쉽게 구현할 수 있습니다.

#Python #OpenCV

참고 자료

OpenCV 공식 문서: https://opencv.org/
Python 공식 문서: https://www.python.org/