[python] 파이썬으로 오디오 파일의 음성을 텍스트로 변환하는 방법

22 Nov 2023

python

음성 인식은 파이썬을 사용하여 오디오 파일의 음성을 텍스트로 변환하는 강력한 기능입니다. 이 기술을 활용하면 오디오 파일이나 녹음된 음성을 텍스트로 자동으로 변환하여 텍스트로 작업할 수 있습니다. 이 문서에서는 파이썬의 SpeechRecognition 라이브러리를 사용하여 오디오 파일의 음성을 텍스트로 변환하는 방법에 대해 알아보겠습니다.

필요한 패키지 설치

음성을 텍스트로 변환하기 위해 SpeechRecognition 패키지를 설치해야 합니다. 아래의 명령을 사용하여 패키지를 설치할 수 있습니다.

pip install SpeechRecognition

오디오 파일에서 음성 인식하기

다음은 SpeechRecognition 패키지를 사용하여 오디오 파일에서 음성을 인식하는 예제 코드입니다.

import speech_recognition as sr

# 오디오 파일 경로
audio_file = "audio.wav"

# Recognizer 생성
r = sr.Recognizer()

# 오디오 파일 열기
with sr.AudioFile(audio_file) as source:
    # 오디오 파일을 읽어들이고 음성을 인식
    audio = r.record(source)

    # 음성을 텍스트로 변환
    text = r.recognize_google(audio, language="ko-KR")

# 변환된 텍스트 출력
print(text)

위 예제에서는 speech_recognition 모듈을 sr로 임포트하고 Recognizer 객체를 생성합니다. 오디오 파일 경로를 지정한 후 AudioFile()을 사용하여 파일을 열고 record() 메서드를 사용하여 음성을 읽어들입니다. 그런 다음 recognize_google() 메서드를 사용하여 음성을 텍스트로 인식합니다. 이전에 pip install SpeechRecognition 명령으로 설치한 SpeechRecognition 모듈은 Google의 음성 인식 API를 사용하여 음성을 텍스트로 변환합니다.

위의 코드를 실행하고 오디오 파일 경로를 올바르게 설정한 후, 음성 파일에서 텍스트 변환이 성공하면 변환된 텍스트가 콘솔에 출력됩니다.

결론

파이썬의 SpeechRecognition 라이브러리를 사용하면 오디오 파일의 음성을 텍스트로 자동 변환할 수 있습니다. 이를 활용하여 음성 데이터를 텍스트로 바로 활용하거나 다른 작업에 사용할 수 있습니다.

더 자세한 정보를 원하는 경우, SpeechRecognition 라이브러리의 공식 GitHub 저장소를 참고하십시오.