安装语音包
cd catkin_ws/src
git clone https://github.com/DinnerHowe/simple_voice.git
最好直接下载,拷贝后有不好使的情况
将百度语音包baidu_speech重命名为simple_voice(https://mp.csdn.net/mdeditor/88899627#)
安装依赖项
sudo apt-get install python-pyaudio
sudo cp vlc-python/generated/vlc.py /usr/lib/python2.7/
sudo apt-get install python-requests
sudo apt-get install vlc
sudo apt-get install libvlc*
运行并测试百度语音包中的说话者(simple_speaker.launch)和语音识别(simple_voice.launch)
cd ..(进入catkin_ws文件下)
catkin_make
source ./devel/setup.bash
roslaunch simple_voice simple_speaker.launch
运行完simple_speaker.launch后,多出了一个/speak_string的话题,该话题就是接收音频文件,需要手动的添加音频文件到simple_speaker节点,其中该launch文件只开启了一个节点就是simple_speaker。
打开另一个终端,向simple_speaker节点添加音频文件:
roscd simple_voice/src
rostopic pub /speak_string std_msgs/String -- '请让一下.mp3'
这个步骤就是加载给出的“请让一下.mp3”到节点,关于rostopic pub的使用方法在此就不介绍了,大家可以查看rostopic的使用。这两步完成后,就可以听到电脑发出“请让一下,谢谢!”的语音了。
关于测试simple_voice.launch是容易的,直接一条命令搞定:
roslaunch simple_voice simple_voice.launch
每次只识别一次,识别完成后需要桥下Enter键才能继续识别,当然大家也可以对voice_node.py进行改造,变成实时语音识别。
[1]https://blog.csdn.net/u011118482/article/details/55001444