[python] 파이썬으로 음성 데이터의 시간 영역과 주파수 영역을 분석하기

15 Dec 2023

python

음성 신호는 시간 영역에서의 파형과 주파수 영역에서의 주파수 컴포넌트로 설명됩니다. 파이썬을 사용하여 음성 데이터를 이러한 두 가지 영역에서 분석하는 방법을 살펴보겠습니다.

1. 시간 영역에서의 분석

음성 데이터를 시간 영역에서 분석하기 위해, 먼저 음성 파일을 읽어들인 후 waveform 시각화를 통해 파형을 확인할 수 있습니다. 파이썬의 librosa 라이브러리를 사용하여 다음과 같이 시간 영역에서의 파형을 그래프로 그릴 수 있습니다.

import librosa
import librosa.display
import matplotlib.pyplot as plt

# 음성 파일 불러오기
audio_path = 'path_to_audio_file.wav'
y, sr = librosa.load(audio_path)

# 파형 그래프 그리기
plt.figure(figsize=(12, 8))
librosa.display.waveshow(y, sr=sr)
plt.title('Waveform of Audio Signal')
plt.show()

2. 주파수 영역에서의 분석

음성 데이터의 주파수 영역을 분석하기 위해, 주파수 스펙트럼 (Frequency Spectrum) 을 시각화하여 주파수 컴포넌트를 확인할 수 있습니다. 파이썬의 librosa 라이브러리와 matplotlib을 사용하여 다음과 같이 주파수 스펙트럼을 그래프로 그릴 수 있습니다.

# 주파수 스펙트럼 그래프 그리기
D = librosa.amplitude_to_db(librosa.stft(y), ref=np.max)
plt.figure(figsize=(12, 8))
librosa.display.specshow(D, sr=sr, x_axis='time', y_axis='log')
plt.colorbar(format='%+2.0f dB')
plt.title('Spectrogram of Audio Signal')
plt.show()

위의 예시 코드를 통해, 파이썬을 사용하여 음성 데이터의 시간 영역과 주파수 영역을 각각 분석하는 방법에 대해 알아보았습니다.

이렇듯 파이썬을 사용하면 음성 데이터를 다양한 시각화 방법을 통해 분석할 수 있으며, 이를 통해 음성 처리 및 분석에 대한 통찰을 얻을 수 있습니다.

1. 시간 영역에서의 분석

2. 주파수 영역에서의 분석

참고 자료