파이썬을 사용한 음풍 분석 및 처리 기술 구현 방법

25 Sep 2023

python

음향 분석 및 처리는 음향 데이터를 수집하고 분석하여 음향 신호를 이해하고 처리하는 기술입니다. 이러한 기술은 음악, 음성 및 환경 소음 분석 등 다양한 분야에서 활용됩니다. 이번 블로그 포스트에서는 파이썬을 사용하여 음향 분석 및 처리 기술을 구현하는 방법에 대해 알아보겠습니다.

1. 음향 데이터 수집

음향 데이터를 수집하기 위해 마이크로폰을 사용하여 파이썬에서 오디오 스트림을 캡처합니다. 이를 위해 pyaudio 라이브러리를 사용할 수 있습니다. 다음은 파이썬에서 오디오 스트림을 캡처하는 간단한 예제 코드입니다.

import pyaudio
import wave

FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
CHUNK = 1024
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

audio = pyaudio.PyAudio()

stream = audio.open(format=FORMAT, channels=CHANNELS,
                rate=RATE, input=True,
                frames_per_buffer=CHUNK)

print("Recording...")

frames = []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)

print("Finished recording...")

stream.stop_stream()
stream.close()
audio.terminate()

waveFile = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
waveFile.setnchannels(CHANNELS)
waveFile.setsampwidth(audio.get_sample_size(FORMAT))
waveFile.setframerate(RATE)
waveFile.writeframes(b''.join(frames))
waveFile.close()

이 예제 코드는 5초 동안 오디오 스트림을 캡처하고 “output.wav” 파일로 저장하는 기능을 제공합니다.

2. 음향 신호 분석

음향 신호를 분석하기 위해 파이썬에서는 여러 라이브러리들을 활용할 수 있습니다. 예를 들어, scipy 라이브러리의 signal 모듈을 사용하여 오디오 파일을 로드하고 FFT(Fast Fourier Transform)를 수행할 수 있습니다. FFT를 통해 주파수 영역에서 음향 신호를 분석할 수 있습니다.

import numpy as np
import scipy.io.wavfile as wav
from scipy import signal
import matplotlib.pyplot as plt

# WAV 파일 로드
sample_rate, samples = wav.read('output.wav')

# FFT 수행
frequencies, times, spectrogram = signal.spectrogram(samples, sample_rate)

# 스펙트로그램 시각화
plt.pcolormesh(times, frequencies, 10 * np.log10(spectrogram))
plt.ylabel('Frequency [Hz]')
plt.xlabel('Time [sec]')
plt.colorbar(label='Intensity [dB]')
plt.show()

이 예제 코드는 “output.wav” 파일을 로드하고 스펙트로그램을 생성하여 시각화하는 방법을 보여줍니다.

3. 음향 신호 처리

음향 신호를 처리하기 위해 파이썬에서는 다양한 라이브러리를 사용할 수 있습니다. 예를 들어, scipy 라이브러리의 signal 모듈을 사용하여 필터링이나 이퀄라이저를 적용할 수 있습니다. 또는 librosa 라이브러리를 사용하여 음악 신호를 특징 벡터로 변환하거나 주파수 영역에서 변형을 수행할 수도 있습니다.

import numpy as np
import librosa
import matplotlib.pyplot as plt

# 오디오 파일 로드
audio_file = 'output.wav'
samples, sample_rate = librosa.load(audio_file)

# 음향 신호 특징 벡터 추출
mfccs = librosa.feature.mfcc(y=samples, sr=sample_rate)

# 음향 신호 특징 벡터 시각화
plt.figure(figsize=(10, 4))
librosa.display.specshow(mfccs, x_axis='time')
plt.colorbar(format='%+2.0f dB')
plt.title('Mel-frequency cepstral coefficients (MFCCs)')
plt.tight_layout()
plt.show()

이 예제 코드는 “output.wav” 파일을 로드하고 MFCC(Mel-frequency cepstral coefficients) 특징 벡터를 추출하여 시각화하는 방법을 보여줍니다.

마무리

이처럼 파이썬을 사용하여 음향 분석 및 처리 기술을 구현할 수 있습니다. 파이썬의 다양한 라이브러리들을 활용하면 음향 데이터를 수집하고 분석하여 다양한 분야에서 활용할 수 있습니다. 이를 통해 음악, 음성 및 환경 소음 분석 등에 대한 연구 및 응용 개발이 가능해집니다.

#음향분석 #음향처리