파이썬으로 OpenCV를 이용하여 동영상에서 사물 인식하기

17 Oct 2023

opencv

이번 포스트에서는 파이썬과 OpenCV를 사용하여 동영상에서 사물을 인식하는 방법에 대해 알아보겠습니다. OpenCV는 컴퓨터 비전과 이미지 처리를 위한 라이브러리로 많이 사용되며, 사물 인식을 위한 다양한 기능을 제공합니다.

1. OpenCV 설치하기

먼저 OpenCV를 설치해야 합니다. 아래의 명령을 사용하여 파이썬에서 OpenCV를 설치할 수 있습니다.

pip install opencv-python

2. 동영상 파일 로드하기

사물 인식을 위해 동영상 파일을 로드해야 합니다. OpenCV를 사용하여 동영상을 열고 프레임 단위로 읽어올 수 있습니다.

import cv2

# 동영상 파일 열기
video = cv2.VideoCapture('video.mp4')

# 프레임 단위로 동영상 읽기
while (video.isOpened()):
    ret, frame = video.read()
    
    # 프레임 처리 작업
    # ...
    
    cv2.imshow('Frame', frame)
    
    # 키 입력 대기
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 리소스 해제
video.release()
cv2.destroyAllWindows()

3. 사물 인식 모델 로드하기

사물을 인식하기 위해서는 미리 학습된 모델을 로드해야 합니다. 여러가지 사물 인식 모델이 있으며, 주로 TensorFlow나 PyTorch를 사용하여 학습된 모델을 사용합니다.

import cv2
import numpy as np

# 사물 인식 모델 로드하기
net = cv2.dnn.readNetFromTensorflow('model.pb')

# 사물 클래스 리스트 로드하기
with open('classes.txt', 'r') as f:
    classes = f.read().splitlines()

# 동영상 파일 열기
video = cv2.VideoCapture('video.mp4')

while (video.isOpened()):
    ret, frame = video.read()
    
    # 사물 인식을 위해 입력 이미지 전처리
    blob = cv2.dnn.blobFromImage(frame, size=(300, 300), swapRB=True, crop=False)
    net.setInput(blob)
    
    # 사물 인식 수행
    detections = net.forward()
    
    # 인식된 사물에 사각형 그리기
    for i in range(detections.shape[2]):
        confidence = detections[0, 0, i, 2]
        
        # 인식된 사물의 신뢰도가 0.5 이상인 경우
        if confidence > 0.5:
            class_id = int(detections[0, 0, i, 1])
            
            # 인식된 사물의 경계 상자 추출
            x = int(detections[0, 0, i, 3] * frame.shape[1])
            y = int(detections[0, 0, i, 4] * frame.shape[0])
            width = int(detections[0, 0, i, 5] * frame.shape[1])
            height = int(detections[0, 0, i, 6] * frame.shape[0])
            
            # 경계 상자와 클래스명 표시
            cv2.rectangle(frame, (x, y), (width, height), (0, 255, 0), 2)
            cv2.putText(frame, classes[class_id], (x, y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
    
    cv2.imshow('Frame', frame)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

video.release()
cv2.destroyAllWindows()

위의 예제는 TensorFlow에서 학습된 사물 인식 모델과 클래스 리스트 파일을 사용하는 예제입니다. 필요에 따라 모델과 클래스 리스트를 변경하여 사용할 수 있습니다.

결론

본 포스트에서는 파이썬과 OpenCV를 이용하여 동영상에서 사물 인식을 수행하는 방법에 대해 알아보았습니다. OpenCV의 다양한 기능과 학습된 사물 인식 모델을 조합하여 실시간으로 사물을 인식하는 프로그램을 개발할 수 있습니다. 이를 응용하여 영상 처리나 로봇 비전 등 다양한 분야에서 활용할 수 있습니다.

더 많은 정보를 원하신다면 아래의 링크를 참조해주세요.