语音信号的时域处理(二)

通过短时时域处理技术,可获得语音信号的相关特性。今天,介绍如何利用短时自相关函数提取语音信号中的基音。

那么,什么是基音呢?声带每开启和闭合一次的时间称音调周期或基音周期,其倒数称为基音频率,简称基音。基音与个人声带的长短、薄厚、韧性、劲度和发音习惯等有关,在很大程度上反应了个人的特征。此外,基音还随人的性别、年龄而定,老年男性偏低(约50Hz),小孩和青年女性偏高(约450Hz)。基音主要应用于低码率语音编码、语音分析与合成、语音识别和说话人识别等,在语音信号领域占据非常重要的地位。

短时自相关函数公式:
在这里插入图片描述
短时自相关函数具有一些特点:
1)当k取0时,函数为最大值,此时自相关函数的取值就是该信号的短时能量(参见之前的文章);
2)如果原序列是周期为T的周期信号,那么自相关函数也是周期为T的周期函数。利用该特点,可以计算语音信号里的基音。

举个栗子:

在这里插入图片描述
在这里插入图片描述
上图是基于44100Hz采样率采集的时长为0.9秒的语音信号,设帧长为1200,帧移为600,取红框内(人声部分)的一帧,如下图所示。
在这里插入图片描述

图(a) 人声部分的某一帧

在这里插入图片描述

图(b) 该帧的自相关函数

由上图(b)所示,除去第一个最大值后(0处),最大值在k= 236处,那么该帧对应的基音频率为:

在这里插入图片描述
除此之外,短时自相关函数还可以用来进行端点检测,判断一个语音是浊音还是清音等。好了,今天的内容就讲这么多,下期见!

发布了24 篇原创文章 · 获赞 2 · 访问量 4138

猜你喜欢

转载自blog.csdn.net/Leisure_ksj/article/details/104130362