[python] FastAPI로 음성 인식 서비스 구현하기

18 Dec 2023

python

음성 인식 서비스를 구현하는 것은 하나의 강력한 기능입니다. FastAPI를 사용하여 간단하게 음성 인식 서비스를 구현하는 방법에 대해 알아보겠습니다.

FastAPI란 무엇인가?

FastAPI는 빠르고 현대적인 웹 애플리케이션을 위한 웹 프레임워크입니다. Python을 사용하며, 고성능 및 간결한 코드 작성을 지원하며, API 구현에 최적화되어 있습니다.

음성 인식 기능 추가하기

먼저, FastAPI를 설치합니다.

pip install fastapi

다음으로, 음성 인식을 지원하는 라이브러리를 설치합니다. 이 예시에서는 Google의 SpeechRecognition 라이브러리를 사용할 것입니다.

pip install SpeechRecognition

이제, FastAPI 애플리케이션을 작성하고 음성 파일을 인식하는 엔드포인트를 추가합니다.

from fastapi import FastAPI, UploadFile, File
import speech_recognition as sr

app = FastAPI()

@app.post("/recognize-speech/")
async def recognize_speech(file: UploadFile = File(...)):
    recognizer = sr.Recognizer()
    audio_file = await file.read()
    
    with sr.AudioFile(audio_file) as source:
        audio_data = recognizer.record(source)
        text = recognizer.recognize_google(audio_data)
        return {"text": text}

위 코드는 FastAPI를 사용하여 /recognize-speech/ 엔드포인트를 작성하고, 클라이언트가 POST 요청을 보내면 음성 파일을 받아 인식 후 텍스트로 반환하는 기능을 구현한 것입니다.

결론

FastAPI를 사용하여 간단하고 효과적으로 음성 인식 서비스를 구현할 수 있습니다. 빠른 개발과 효율적인 성능을 제공하는 FastAPI의 장점을 활용하여 음성 인식 기능을 웹 애플리케이션에 쉽게 추가할 수 있습니다.

이것은 곧 활용 가능한 음성 기반 기술들에 더 많은 기회를 제공할 것입니다.

목차

FastAPI란 무엇인가?

음성 인식 기능 추가하기

결론