[python] 파이썬으로 음성 신호의 시간-주파수 표현 그리기

15 Dec 2023

python

음성 신호를 분석하고 그래픽으로 표현하는 것은 음성 처리 분야에서 중요한 주제 중 하나입니다. 이를 위해 파이썬의 다양한 라이브러리를 사용하여 음성 신호를 시간-주파수 영역에서 시각화하는 방법을 알아보겠습니다.

1. 음성 신호 불러오기

우선, 음성 신호를 불러와야 합니다. 예를 들어, scipy 라이브러리의 wavfile 모듈을 사용하여 WAV 파일에서 음성 신호를 로드할 수 있습니다.

from scipy.io import wavfile

# WAV 파일 불러오기
sample_rate, data = wavfile.read('음성파일.wav')

2. 음성 신호의 시간 영역 표현

불러온 음성 신호를 시간 영역에서 표현하기 위해 matplotlib 라이브러리를 사용합니다. 이를 통해 음성 신호를 파형 그래프로 시각화할 수 있습니다.

import matplotlib.pyplot as plt
import numpy as np

# 시간 영역 그래프 플로팅
time = np.arange(0, len(data)) / sample_rate
plt.plot(time, data)
plt.xlabel('Time (s)')
plt.ylabel('Amplitude')
plt.title('Waveform of the Audio Signal')
plt.show()

3. 음성 신호의 주파수 영역 표현

이제 음성 신호의 주파수 영역을 분석하고 표현해 보겠습니다. 여기서는 FFT(Fast Fourier Transform)를 사용하여 주파수 영역을 얻을 수 있습니다.

# FFT를 통한 주파수 영역 분석
n = len(data)
frequencies = np.fft.fftfreq(n, d=1/sample_rate)
fft_values = np.abs(np.fft.fft(data))

# 주파수 영역 그래프 플로팅
plt.plot(frequencies[:n//2], fft_values[:n//2])
plt.xlabel('Frequency (Hz)')
plt.ylabel('Amplitude')
plt.title('Frequency Domain Representation of the Audio Signal')
plt.show()

결론

이처럼 파이썬을 사용하여 음성 신호의 시간-주파수 표현을 그릴 수 있습니다. 이러한 시각화를 통해 음성 신호를 더 잘 이해하고 분석할 수 있습니다.

참고 문헌:

다음은 올바르게 작동하는지 확인하고 결과를 확인하기 위해 코드를 실행해 보세요.