thchs30运行流程以及在线、离线识别

（1）thchs30运行过程以及bug修复

按照网上教程，训练thchs30首先需要将run脚本中的变量定位到你存储数据的位置，其次是修改cmd脚本中的queue为run.pl。但是不知道是我的主机原因还是系统的原因，总是不行，后来博主一步一步运行了脚本，发现对于ubuntu16和ubuntu14是有很大的差别的。

首先，Ubuntu16是14的进化版，但是博主还是建议各位大佬装14，因为16不稳定，而且容易出现毛病，而且在kaldi官网也明确说明了，安装kaldi首选是Ubuntu14,。现在讲一下我的踩坑过程，首先是博主的 cp -R 命令在终端可以执行，到了脚本里面就是不能执行，没办法，我只能按照脚本的步骤，手动操作了（还有一种办法是将cp -R里面分分步执行）。

其次，是我在运行到对齐的时候出毛病，出现一堆数字，如下：

具体原因：暂时不明，对对齐没有研究。

最后由于是机器的原因，在运行的过程中总是出现alloc这个error，一直出现内存不够。解决方法是将nj调小，将n调小，在run脚本中将mono tri tri2b等后面的 & 去掉，具体原因也不知道，但是就是对了。

这就是在训练过程中遇到的问题，如果遇到有问题，请给留言。

（2）在线、离线识别的运行以及bug修复

离线的过程和在线的过程，参照下面两篇博客，但是有一些bug：

https://blog.csdn.net/snowdroptulip/article/details/78950038

https://blog.csdn.net/lijin6249/article/details/51838936?locationNum=4&fps=1

其中的bug大致可以分三步解决：

1：首先检查linux 的录音功能是否正常：arecord命令，采用arecord -l检查录音设备是否正常，但是我采用的是audacity进行录音，具体学习方法在我的博客里面存在；

2：检查portaudio是否安装成功，可以使用tools/install_portaudio.sh进行安装，如果之前安装过一遍，可以采用make clean；然后make进行重新安装，然后在portaudio下进行./configure,通常情况下alsa显示是no，可以通过apt-get install libasound-dev进行安装；

3：最后就是检查online-wav-gmm-decode-faster是否变异出来，如果出问题，可以进入src/online和src/onlinebin下，分别进行make clean 然后make，大致可以解决。

（3）总结

在修改脚本的时候，建议各位大佬还是先进行备份，然后再进行修改，以防修改之后不知道如何还原；

不断学习，不断踩坑，才能得到成长，欢迎各位大佬给我留言或者互相学习。

参考文献：https://blog.csdn.net/xwei1226/article/details/80238849

thchs30运行流程以及在线、离线识别

猜你喜欢