语音信号处理分类

  1. 人与人之间的通信:语音压缩与编码
    压缩语音信号的传输带宽或者降低电话信道的传输码率

解释:比特率=位深X采样率X信道个数,比特率越高,还原度越高,速度越慢。所以降低编码比特率,可以节省频率资源。

  1. 第一类人与机器之间的通信:语音合成
    机器讲话,人接听

文语转换(TTS)系统,主要关注可理解度,自然度,可懂度,逼真度(情感语音合成)

  1. 第二类人与机器之间的通信:语音识别
    人讲话,机器接听

语音识别困难是因为:语音信号多变性、动态性、瞬时性和连续性。
语音情感识别是重要分支:提取的特征包括韵律特征、音质特征和谱特征;语音情感识别的网络包括HMM、GMM、SVM、ANN等。

发布了5 篇原创文章 · 获赞 0 · 访问量 206

猜你喜欢

转载自blog.csdn.net/weixin_42846157/article/details/104485335