[python] FastAPI로 음성 인식 서비스 구현하기

음성 인식 서비스를 구현하는 것은 하나의 강력한 기능입니다. FastAPI를 사용하여 간단하게 음성 인식 서비스를 구현하는 방법에 대해 알아보겠습니다.

목차

FastAPI란 무엇인가?

FastAPI는 빠르고 현대적인 웹 애플리케이션을 위한 웹 프레임워크입니다. Python을 사용하며, 고성능 및 간결한 코드 작성을 지원하며, API 구현에 최적화되어 있습니다.

음성 인식 기능 추가하기

먼저, FastAPI를 설치합니다.

pip install fastapi

다음으로, 음성 인식을 지원하는 라이브러리를 설치합니다. 이 예시에서는 Google의 SpeechRecognition 라이브러리를 사용할 것입니다.

pip install SpeechRecognition

이제, FastAPI 애플리케이션을 작성하고 음성 파일을 인식하는 엔드포인트를 추가합니다.

from fastapi import FastAPI, UploadFile, File
import speech_recognition as sr

app = FastAPI()

@app.post("/recognize-speech/")
async def recognize_speech(file: UploadFile = File(...)):
    recognizer = sr.Recognizer()
    audio_file = await file.read()
    
    with sr.AudioFile(audio_file) as source:
        audio_data = recognizer.record(source)
        text = recognizer.recognize_google(audio_data)
        return {"text": text}

위 코드는 FastAPI를 사용하여 /recognize-speech/ 엔드포인트를 작성하고, 클라이언트가 POST 요청을 보내면 음성 파일을 받아 인식 후 텍스트로 반환하는 기능을 구현한 것입니다.

결론

FastAPI를 사용하여 간단하고 효과적으로 음성 인식 서비스를 구현할 수 있습니다. 빠른 개발과 효율적인 성능을 제공하는 FastAPI의 장점을 활용하여 음성 인식 기능을 웹 애플리케이션에 쉽게 추가할 수 있습니다.

이것은 곧 활용 가능한 음성 기반 기술들에 더 많은 기회를 제공할 것입니다.