梅尔倒谱系数特征(Mel-frequency cepstral coefficients,MFCC)

引言

感知实验表明,人耳对于声音信号的感知聚焦于某一特定频率区域内,而非在整个频谱包络中。

MFCC特征是应用非常广泛的语音特征。

语音的MFCC特征是基于人耳感知实验得到,将人耳当成特定的滤波器,只考虑某些特定频率成分。这些滤波器是在频域上不均匀分布的。更多的滤波器聚集于低频部分,高频部分的滤波器较少。采样率16Khz时,下图实例:

MFCC计算及其意义

MFCC是一种倒谱特征,计算意义见下图:

其中,对于声音信号,一般会进行分帧后再提取特征,利用不同的窗函数实现。

MFCC可以描述为:【Spectrum → Mel-Filters → Mel-Spectrum】

先计算当前帧数据的频谱(FFT)得到短时谱,再经过MEL滤波器滤波,输出对数MEL能量谱,经过DCT去相关,得到MFCC系数(此时特征维数由DCT系数数目决定)。

其中,经过对数操作之后,有同态信号处理的意思。

经过特征提取,语音信号可以通过一系列的倒谱向量表示。

猜你喜欢

转载自www.cnblogs.com/ytxwzqin/p/10717978.html
今日推荐