[파이썬][AI Chatbot] SpeechRecognition의 ASR을 위한 python예제
SpeechRecognition은 Python에서 사용할 수 있는 ASR (Automatic Speech Recognition) 라이브러리입니다. 이를 통해 음성 데이터를 텍스트로 변환할 수 있습니다. 아래는 SpeechRecognition을 사용하여 음성 데이터를 텍스트로 변환하는 예제 코드입니다.
SpeechRecognition 라이브러리를 설치하려면 다음 명령어를 사용합니다:
pip install SpeechRecognition`
다음은 SpeechRecognition을 사용한 ASR 예제 코드입니다:
import speech_recognition as sr
## 음성 인식기 객체 생성
recognizer = sr.Recognizer()
## 음성 파일 불러오기 (wav 형식)
audio_file = "path/to/your/audio.wav"
## 음성 파일 열기
with sr.AudioFile(audio_file) as source:
audio = recognizer.record(source)
try:
# 음성을 텍스트로 변환
text = recognizer.recognize_google(audio)
print("Recognized Text:", text)
except sr.UnknownValueError:
print("Could not understand audio")
except sr.RequestError as e:
print("Error during request to Google Speech Recognition service:", e)`
위의 코드는 주어진 음성 파일을 텍스트로 변환하는 예제입니다. recognize_google
함수는 Google의 음성 인식 서비스를 사용하여 음성을 텍스트로 변환합니다. 다른 음성 인식 엔진들도 recognize_sphinx
, recognize_wit
, recognize_bing
등을 사용하여 대체할 수 있습니다.
주의: 이 코드는 Google의 음성 인식 서비스에 의존하므로 인터넷 연결이 필요합니다. 또한, 음성 파일은 WAV 형식으로 제공되어야 합니다.
더 복잡한 응용을 위해서는 오디오 파일의 녹음, 실시간 스트림 처리, 노이즈 제거 등을 고려할 수 있습니다.