[python] 파이썬으로 오디오 파일의 첫 음계를 자동으로 탐지하는 방법

22 Nov 2023

python

오디오 파일의 첫 음계를 자동으로 탐지하는 것은 음악 분석 및 오디오 신호 처리와 관련된 흥미로운 주제입니다. 이번 블로그 포스트에서는 파이썬을 사용하여 오디오 파일의 첫 음계를 탐지하는 방법을 알아보겠습니다.

1. 오디오 파일 읽기

먼저, 파이썬에서 오디오 파일을 읽어야 합니다. 이를 위해 librosa라는 라이브러리를 사용할 수 있습니다. 아래의 명령을 사용하여 librosa를 설치하세요.

pip install librosa

오디오 파일을 읽기 위해 librosa.load() 함수를 사용합니다. 아래는 예시 코드입니다.

import librosa

# 오디오 파일 경로 설정
audio_path = "audio.wav"

# 오디오 파일을 읽고 waveform과 샘플링 주파수를 반환
waveform, sr = librosa.load(audio_path)

2. 음계 탐지

오디오 파일을 읽었다면, 이제 음계를 탐지할 차례입니다. 일반적으로 오디오 분석에서 음계를 식별하기 위해서는 주파수 분석이 사용됩니다.

먼저, librosa.stft() 함수를 사용하여 스펙트로그램을 계산합니다. 스펙트로그램은 오디오 신호의 주파수 내용을 시간에 따라 표현한 것입니다.

import numpy as np
import librosa

# 오디오 파일 경로 설정
audio_path = "audio.wav"

# 오디오 파일을 읽고 waveform과 샘플링 주파수를 반환
waveform, sr = librosa.load(audio_path)

# 스펙트로그램 계산
stft = librosa.stft(waveform)

스펙트로그램을 계산했다면, 이제 주파수별로 가장 높은 음량을 가지는 주파수를 추출할 수 있습니다. 이를 통해 주파수를 음계로 변환할 수 있습니다.

import numpy as np
import librosa

# 오디오 파일 경로 설정
audio_path = "audio.wav"

# 오디오 파일을 읽고 waveform과 샘플링 주파수를 반환
waveform, sr = librosa.load(audio_path)

# 스펙트로그램 계산
stft = librosa.stft(waveform)

# 주파수별로 가장 높은 음량을 가지는 주파수를 추출
frequencies = np.abs(stft)
max_freq = np.argmax(frequencies, axis=0)

# 주파수를 음계로 변환
note_number = np.where(max_freq == 0, 0, 12 * np.log2(max_freq / 440) + 69)
note_name = librosa.core.midi_to_note_melody(note_number)

이제 note_name에는 오디오 파일의 첫 음계가 포함되어 있습니다.

3. 결과 출력

마지막으로, 탐지한 첫 음계를 출력하는 코드를 작성할 수 있습니다.

import numpy as np
import librosa

# 오디오 파일 경로 설정
audio_path = "audio.wav"

# 오디오 파일을 읽고 waveform과 샘플링 주파수를 반환
waveform, sr = librosa.load(audio_path)

# 스펙트로그램 계산
stft = librosa.stft(waveform)

# 주파수별로 가장 높은 음량을 가지는 주파수를 추출
frequencies = np.abs(stft)
max_freq = np.argmax(frequencies, axis=0)

# 주파수를 음계로 변환
note_number = np.where(max_freq == 0, 0, 12 * np.log2(max_freq / 440) + 69)
note_name = librosa.core.midi_to_note_melody(note_number)

# 첫 음계 출력
first_note = note_name[0]
print("첫 음계:", first_note)

이제 오디오 파일의 첫 음계를 자동으로 탐지하는 파이썬 코드를 작성했습니다. 위 코드를 실행하면 첫 음계가 출력됩니다.

참고: 이 예제 코드는 간단한 오디오 파일에 대해서만 작동합니다. 복잡한 음악 신호에 대한 음계 탐지는 더 복잡한 알고리즘이 필요합니다.

결론

이번 포스트에서는 파이썬을 사용하여 오디오 파일의 첫 음계를 자동으로 탐지하는 방법을 알아보았습니다. librosa와 같은 오디오 처리 라이브러리를 사용하면 이러한 작업을 더 쉽게 수행할 수 있습니다. 오디오 처리에 관심이 있다면 librosa와 같은 라이브러리를 공부해보세요.