파이썬 오디오 라이브러리를 활용한 실시간 음향 분석 및 시각화

25 Sep 2023

python

파이썬은 다양한 분야에서 활용되는 강력한 프로그래밍 언어입니다. 오디오 처리 및 실시간 음향 분석과 같은 음향 관련 작업에도 많이 사용됩니다. 이번 블로그 포스트에서는 파이썬 오디오 라이브러리를 활용하여 실시간 음향 분석 및 시각화를 어떻게 수행하는지 알아보겠습니다.

오디오 라이브러리 선택

파이썬에서는 다양한 오디오 라이브러리가 제공되며, 그 중 몇 가지를 살펴보겠습니다.

PyAudio: 파이썬에서 오디오 녹음 및 재생을 위한 인터페이스를 제공합니다. 실시간 오디오 스트리밍이 가능하며, 다른 오디오 라이브러리와 연동할 수 있습니다.
Librosa: 음악 및 오디오 관련 작업을 위한 파이썬 라이브러리입니다. 음악 신호 처리, 특성 추출, 시간-주파수 변환 등 다양한 기능을 제공합니다.
Sounddevice: 고성능 오디오 입출력을 위한 파이썬 라이브러리입니다. 실시간 오디오 스트리밍 및 재생 기능을 제공하며, 다른 오디오 라이브러리와 연동할 수 있습니다.

이 중에서 필요에 따라 적절한 라이브러리를 선택하여 사용할 수 있습니다.

실시간 음향 분석 및 시각화

실시간 음향 분석 및 시각화를 위해 파이썬 오디오 라이브러리를 사용해 보겠습니다. 아래는 PyAudio를 사용하여 실시간 음향 데이터를 수집하고, Matplotlib를 사용하여 스펙트로그램을 그리는 예제 코드입니다.

import pyaudio
import numpy as np
import matplotlib.pyplot as plt

# 오디오 스트림을 위한 설정
CHUNK = 1024
FORMAT = pyaudio.paFloat32
CHANNELS = 1
RATE = 44100

p = pyaudio.PyAudio()

# 오디오 스트림 열기
stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=RATE,
                input=True,
                frames_per_buffer=CHUNK)

# 스펙트로그램 그리기
fig, ax = plt.subplots()
im = ax.imshow(np.zeros((CHUNK//2 + 1, )))
plt.colorbar(im)

# 실시간 음향 데이터 처리 함수
def process_audio(in_data, frame_count, time_info, status_flags):
    # 입력 데이터를 numpy 배열로 변환
    audio_data = np.frombuffer(in_data, dtype=np.float32)

    # FFT를 사용하여 주파수 스펙트럼 계산
    spectrums = np.abs(np.fft.fft(audio_data))[:CHUNK//2 + 1]

    # 스펙트로그램 업데이트
    im.set_array(spectrums)

    return (in_data, pyaudio.paContinue)

# 오디오 스트림에 콜백 함수 등록
stream.set_callback(process_audio)

# 음향 데이터 수집 및 시각화 시작
stream.start_stream()

# 음향 데이터 수집 및 시각화 종료
stream.stop_stream()
stream.close()
p.terminate()

plt.show()

위의 예제 코드에서는 PyAudio를 사용하여 오디오 스트림을 열고 음향 데이터를 수집합니다. 수집한 음향 데이터는 FFT(고속 퓨리에 변환)를 사용하여 주파수 스펙트럼으로 변환하고, 이를 Matplotlib을 사용하여 스펙트로그램으로 시각화합니다.

마무리

이번 블로그 포스트에서는 파이썬 오디오 라이브러리를 활용하여 실시간 음향 분석 및 시각화를 수행하는 방법을 알아보았습니다. PyAudio와 Matplotlib을 조합하여 음향 데이터를 수집하고 시각화할 수 있습니다. 이를 응용하여 음성 인식, 음악 분석 등 다양한 음향 관련 작업에 적용할 수 있습니다.

#파이썬 #오디오 #실시간분석 #시각화