Search
🔊

Wave data 와 Librosa

Created
7/20/2021, 11:14:51 AM
Tags
wave data
midi data
Librosa
spectrogram
일시
2021/07/20
작성자
엄광호
포스팅 종류
Empty
✅ main

음성 데이터 Basic

음악에서 주로 쓰이는 데이터 형태로는 wave data와 midi data가 있습니다.
간략히 말하면,
wave data는 소리를 디지털 파형으로 저장한 데이터이고, (x축:시간, y축:진폭)
midi data는 각종 악기를 제어하는 전기 신호 데이터입니다. (x축:시간, y축:건반)
소리로 들어볼까연.

Wave Data

신호는 '시간에 따른 일정한 양의 변화량'이고, 오디오 신호의 경우 여기서 변하는 양은 '기압(진폭)'입니다.
소리를 결국 디지털 데이터로 나타내려면, 시간에 따른 기압(진폭)을 채취해야합니다.
'시간에 따라 기압 샘플을 채취한 데이터' = wave data
예를 들어, 44.1kHz는 초당 44,100개의 기압 샘플을 채취한(샘플링한) 것입니다.
이렇게 시간에 따른 기압의 변화라는 단순한 wave data에서 더 유용한 정보를 어떻게 추출할 수 있을까요?
→ Librosa를 이용해봅시다!
Librosa는 이런 음성 데이터를 다루는데 특화된 라이브러리입니다.

Librosa

Librosa 라이브러리 활용해서 sample audio wav 파일을 가지고 놀아봅시다.

1. STFT(Short-Time Fourier Transform)

wav파일 → 단기간 퓨리에변환 → Spectrogram

2. Spectrogram

x축:시간,y축:주파수,색깔:세기

3. ISTFT(Inverse Short-Time Fourier Transform)

Spectrogram → ISTFT → wav파일

4. Mel Spectrogram

A mel spectrogram is a spectrogram where the frequencies are converted to the mel scale.
참조 블로그