[python] 파이썬으로 오디오 파일의 노래 가사를 추출하는 방법

이번 포스트에서는 파이썬을 사용하여 오디오 파일에서 노래 가사를 추출하는 방법에 대해 알아보겠습니다.

1. 필요한 라이브러리 설치

코드를 실행하기 위해 다음과 같은 파이썬 라이브러리를 설치해야 합니다.

pip install SpeechRecognition
pip install pydub
pip install pocketsphinx

2. 오디오 파일 읽기

가사를 추출하기 위해서는 오디오 파일을 파이썬으로 읽어와야 합니다. pydub 라이브러리를 사용하여 오디오 파일을 읽을 수 있습니다.

from pydub import AudioSegment

# 오디오 파일 로드
audio = AudioSegment.from_file("song.mp3", format="mp3")

3. 음성 인식

SpeechRecognition 라이브러리는 음성을 텍스트로 변환하는 기능을 제공합니다. AudioSegment 객체에서 오디오를 추출한 후 SpeechRecognition 라이브러리를 사용하여 음성을 인식할 수 있습니다.

import speech_recognition as sr

# 음성 인식기 생성
r = sr.Recognizer()

# 오디오 파일을 오디오 스트림으로 변환
audio_stream = sr.AudioData(audio.export(format="wav").raw_data, sample_rate=audio.frame_rate, sample_width=audio.sample_width)

# 음성을 인식하여 텍스트로 변환
text = r.recognize_google(audio_stream)

print(text)

4. 추출한 가사 확인

음성을 인식하여 추출한 가사를 출력해보겠습니다.

5. 코드 실행

위의 코드를 모두 작성한 후에는 파이썬 스크립트를 실행하여 노래의 가사를 추출할 수 있습니다.

$ python extract_lyrics.py

결론

이렇게 파이썬을 사용하여 오디오 파일의 노래 가사를 추출하는 방법에 대해 알아보았습니다. 노래 가사 추출은 음악 관련 애플리케이션 개발에 유용하게 활용될 수 있습니다.

참고 자료