[파이썬][AI Chatbot] SpeechRecognition의 ASR을 위한 python예제

18 Aug 2023

챗봇

SpeechRecognition은 Python에서 사용할 수 있는 ASR (Automatic Speech Recognition) 라이브러리입니다. 이를 통해 음성 데이터를 텍스트로 변환할 수 있습니다. 아래는 SpeechRecognition을 사용하여 음성 데이터를 텍스트로 변환하는 예제 코드입니다.

SpeechRecognition 라이브러리를 설치하려면 다음 명령어를 사용합니다:

pip install SpeechRecognition`

다음은 SpeechRecognition을 사용한 ASR 예제 코드입니다:

import speech_recognition as sr

## 음성 인식기 객체 생성
recognizer = sr.Recognizer()

## 음성 파일 불러오기 (wav 형식)
audio_file = "path/to/your/audio.wav"

## 음성 파일 열기
with sr.AudioFile(audio_file) as source:
    audio = recognizer.record(source)

try:
    # 음성을 텍스트로 변환
    text = recognizer.recognize_google(audio)
    print("Recognized Text:", text)
except sr.UnknownValueError:
    print("Could not understand audio")
except sr.RequestError as e:
    print("Error during request to Google Speech Recognition service:", e)` 

위의 코드는 주어진 음성 파일을 텍스트로 변환하는 예제입니다. recognize_google 함수는 Google의 음성 인식 서비스를 사용하여 음성을 텍스트로 변환합니다. 다른 음성 인식 엔진들도 recognize_sphinx, recognize_wit, recognize_bing 등을 사용하여 대체할 수 있습니다.

주의: 이 코드는 Google의 음성 인식 서비스에 의존하므로 인터넷 연결이 필요합니다. 또한, 음성 파일은 WAV 형식으로 제공되어야 합니다.

더 복잡한 응용을 위해서는 오디오 파일의 녹음, 실시간 스트림 처리, 노이즈 제거 등을 고려할 수 있습니다.