[python] 파이썬으로 음성 데이터의 주파수 성분 분석하기

15 Dec 2023

python

음성 데이터를 분석하는 것은 음성 처리 및 인식 분야에서 중요한 과제 중 하나입니다. 음성 데이터의 주파수 성분을 분석해 보면, 음성 신호가 어떻게 구성되어 있는지 이해하는 데 도움이 됩니다. 파이썬을 사용하여 음성 데이터의 주파수 성분을 분석하는 방법에 대해 알아보겠습니다.

1. 음성 데이터 불러오기

먼저, 음성 데이터를 불러와야 합니다. librosa 라이브러리를 사용하여 WAV 파일 형식의 음성 데이터를 불러올 수 있습니다.

import librosa

# 음성 데이터 불러오기
audio_file = "path_to_audio_file.wav"
signal, sr = librosa.load(audio_file, sr=None)

2. 주파수 성분 분석

불러온 음성 데이터를 이용하여 주파수 성분을 분석할 수 있습니다. librosa의 stft 함수를 사용하여 주파수 성분을 분석할 수 있습니다.

import numpy as np

# 주파수 성분 분석
stft_result = librosa.stft(signal)
magnitude = np.abs(stft_result)
phase = np.angle(stft_result)

3. 주파수 성분 시각화

주파수 성분을 분석한 결과를 시각화하여 확인할 수 있습니다. matplotlib 라이브러리를 사용하여 주파수 성분을 시각화할 수 있습니다.

import matplotlib.pyplot as plt

# 주파수 성분 시각화
plt.figure()
plt.subplot(2, 1, 1)
plt.plot(magnitude)
plt.title('Magnitude')
plt.subplot(2, 1, 2)
plt.plot(phase)
plt.title('Phase')
plt.show()

이제, 파이썬을 사용하여 음성 데이터의 주파수 성분을 분석하는 방법에 대해 알게 되었습니다. 이를 통해 음성 데이터의 주파수 성분을 이해하고 분석하는 데 도움이 될 것입니다.

참고문헌:

librosa 라이브러리 공식 문서: https://librosa.org/doc/main/index.html
matplotlib 라이브러리 공식 문서: https://matplotlib.org/stable/contents.html