linux系统(ubuntu)调用科大讯飞SDK实现语音识别及语音合成

1.语音识别

登录科大讯飞官网,注册账号后转到“语音识别”栏目,下载SDK,如图:

我选择了 语音听写和语音合成,都是在线的。选好后生成SDK,下载到本地,然后在linux系统中解压,并进入sample目录的iat_online_record_sample目录下。

执行 source 64bit_make.sh

此时会提示“alsa/asound.h:没有那个文件或目录”。解决办法:

sudo apt-get install libasound2-dev

然后就可以去../../bin目录下执行对应的可执行文件了。

ubutnu18的检查麦克风是否可用的设置在这里:

可以通过说话检测input level是否会随之变化。

2.语音合成 

进入到sample目录的tts_online_sample目录下。

执行 source 64bit_make.sh

然后就可以去../../bin目录下执行对应的可执行文件了。

它会根据源码中预设的文本合成语音,并生成wav文件在bin目录下。播放wav文件的方法是

安装
sudo apt-get install sox
sudo apt-get install libsox-fmt-all
然后在C代码中写上
{
    system("play tts_sample.wav");
}
就可以播放了。

于是我通过改这两个文件,合成了一个语音识别后将文字再合成语音播放出来,由于Makefile基本是相同的,因此将各自的main函数合到一起就可以了。

猜你喜欢

转载自blog.csdn.net/qq_38639426/article/details/103409845