thchs30运行流程以及在线、离线识别

(1)thchs30运行过程以及bug修复

按照网上教程,训练thchs30首先需要将run脚本中的变量定位到你存储数据的位置,其次是修改cmd脚本中的queue为run.pl。但是不知道是我的主机原因还是系统的原因,总是不行,后来博主一步一步运行了脚本,发现对于ubuntu16和ubuntu14是有很大的差别的。

  首先,Ubuntu16是14的进化版,但是博主还是建议各位大佬装14,因为16不稳定,而且容易出现毛病,而且在kaldi官网也明确说明了,安装kaldi首选是Ubuntu14,。现在讲一下我的踩坑过程,首先是博主的 cp -R 命令在终端可以执行,到了脚本里面就是不能执行,没办法,我只能按照脚本的步骤,手动操作了(还有一种办法是将cp -R里面分分步执行)。

  其次,是我在运行到对齐的时候出毛病,出现一堆数字,如下:


具体原因:暂时不明,对对齐没有研究。

  最后由于是机器的原因,在运行的过程中总是出现alloc这个error,一直出现内存不够。解决方法是将nj调小,将n调小,在run脚本中将mono tri tri2b等后面的 & 去掉,具体原因也不知道,但是就是对了。

  这就是在训练过程中遇到的问题,如果遇到有问题,请给留言。

(2)在线、离线识别的运行以及bug修复

  离线的过程和在线的过程,参照下面两篇博客,但是有一些bug:

  https://blog.csdn.net/snowdroptulip/article/details/78950038

  https://blog.csdn.net/lijin6249/article/details/51838936?locationNum=4&fps=1

  其中的bug大致可以分三步解决:

    1:首先检查linux 的录音功能是否正常:arecord命令,采用arecord -l检查录音设备是否正常,但是我采用的是audacity进行录音,具体学习方法在我的博客里面存在;

    2:检查portaudio是否安装成功,可以使用tools/install_portaudio.sh进行安装,如果之前安装过一遍,可以采用make clean;然后make进行重新安装,然后在portaudio下进行./configure,通常情况下alsa显示是no,可以通过apt-get install libasound-dev进行安装;

    3:最后就是检查online-wav-gmm-decode-faster是否变异出来,如果出问题,可以进入src/online和src/onlinebin下,分别进行make clean 然后make,大致可以解决。

(3)总结

  在修改脚本的时候,建议各位大佬还是先进行备份,然后再进行修改,以防修改之后不知道如何还原;

  不断学习,不断踩坑,才能得到成长,欢迎各位大佬给我留言或者互相学习。

参考文献:https://blog.csdn.net/xwei1226/article/details/80238849


猜你喜欢

转载自blog.csdn.net/xwei1226/article/details/80241221