unity学习笔记-将VAD语音探测引入unity中进行调用(安卓版)

unity学习笔记


如题,去年做好了语音唤醒的功能,但是因为不知道怎么探测是否有人在讲话,所以这个功能基本就是废了.最近发现了一个使用VAD进行语音探测的教程,尝试了一下,在研究了大概三四个月 (从看到这个教程开始算起),终于实现了在使用百度的语音唤醒之后调用vad进行语音探测同时进行语音录制,在通过vad探测没人讲话的时候结束语音录制,并将语音数据发送给相应的人工智能接口进行智能对话
首先是需要一个百度语音的唤醒,这个前面的帖子有说了就不重新写了
重点说一下vad

https://yeyupiaoling.blog.csdn.net/article/details/105553265

因为时间原因,我按照帖子里的步骤搭了vad的环境,但是因为涉及到c语言,很多方法和参数都很蒙蔽,报错也不知道是为啥,所以我直接使用了教程里分解好了的vad源码(一份是全部的,一份是vad里专门探测人声的)

如下图,关键的结构框了出来
在这里插入图片描述

我们要用的主要是vad的文件夹,其他的都是程序运行时需要的环境

思路大概是,在语音唤醒之后调用vad的语音探测,同时打开语音录制,然后vad的语音探测结束后,关闭语音录制,同时发送消息给需要的接口/方法
在这里插入图片描述
在这里插入图片描述
先写这么多吧.其他注意事项后面再写

2022.7.2更新
百度的唤醒sdk需要在官网上添加对应唤醒程序的包名,如果你是和我一样,在unity里面使用,然后要和原生app进行融合的话,你在官网上添加的包名就需要是融合后的app的包名,像我的是unity打包给原生进行融合,那么官网上有关唤醒的包名就需要是原生app的包名

猜你喜欢

转载自blog.csdn.net/pure81/article/details/124280290