ROS下的百度语音使用

安装语音包

cd catkin_ws/src
git clone https://github.com/DinnerHowe/simple_voice.git

最好直接下载,拷贝后有不好使的情况
将百度语音包baidu_speech重命名为simple_voice(https://mp.csdn.net/mdeditor/88899627#)

安装依赖项

sudo apt-get install python-pyaudio
sudo cp vlc-python/generated/vlc.py /usr/lib/python2.7/
sudo apt-get install python-requests
sudo apt-get install vlc
sudo apt-get install libvlc*

运行并测试百度语音包中的说话者(simple_speaker.launch)和语音识别(simple_voice.launch)

cd ..(进入catkin_ws文件下)
catkin_make
source ./devel/setup.bash
roslaunch simple_voice simple_speaker.launch

运行完simple_speaker.launch后,多出了一个/speak_string的话题,该话题就是接收音频文件,需要手动的添加音频文件到simple_speaker节点,其中该launch文件只开启了一个节点就是simple_speaker。
在这里插入图片描述
打开另一个终端,向simple_speaker节点添加音频文件:

roscd simple_voice/src
rostopic pub /speak_string std_msgs/String -- '请让一下.mp3'

在这里插入图片描述
这个步骤就是加载给出的“请让一下.mp3”到节点,关于rostopic pub的使用方法在此就不介绍了,大家可以查看rostopic的使用。这两步完成后,就可以听到电脑发出“请让一下,谢谢!”的语音了。

关于测试simple_voice.launch是容易的,直接一条命令搞定:

roslaunch simple_voice simple_voice.launch

每次只识别一次,识别完成后需要桥下Enter键才能继续识别,当然大家也可以对voice_node.py进行改造,变成实时语音识别。

[1]https://blog.csdn.net/u011118482/article/details/55001444

猜你喜欢

转载自blog.csdn.net/weixin_43981221/article/details/88902819
今日推荐