Kaldi语音识别CVTE模型实战

一.下载训练好的模型

  下载路径:http://kaldi-asr.org/models/m2

  

二.上传&配置

  1.上传到kaldi/egs/目录下

  

  2.解压,tar -zxvf 0002_cvte_chain_model_v2.tar.gz

  

  备注:因HCLG.fst模型解压后文件较大,在解压过程中会出现停顿,等待片刻即可!

  

  3.将egs/wsj/s5中的steps和utils拷贝到egs/cvte/s5目录下

  

  

  4.将egs/hkust/s5/local/score.sh拷贝到egs/cvte/s5/local/目录下

  

  

  5.注释掉kaldi/egs/cvte/s5/utils/lang/check_phones_compatible.sh中if语句中的exit 1

  

三.CVTE文件结构

  

四.运行示例脚本

  1.运行

  

  2.执行结果

bash: line 1:  5327 Killed                  ( nnet3-latgen-faster --frame-subsampling-factor=3 --frames-per-chunk=50 --extra-left-context=0 --extra-right-context=0 --extra-left-context-initial=-1 --extra-right-context-final=-1 --minimize=false --max-active=7000 --min-active=200 --beam=15.0 --lattice-beam=8.0 --acoustic-scale=1.0 --allow-partial=true --word-symbol-table=exp/chain/tdnn/graph/words.txt exp/chain/tdnn/final.mdl exp/chain/tdnn/graph/HCLG.fst "ark,s,cs:apply-cmvn --norm-means=true --norm-vars=false --utt2spk=ark:data/fbank/test/split1/1/utt2spk scp:data/fbank/test/split1/1/cmvn.scp scp:data/fbank/test/split1/1/feats.scp ark:- |" "ark:|lattice-scale --acoustic-scale=10.0 ark:- ark:- | gzip -c >exp/chain/tdnn/decode_test/lat.1.gz" ) 2>> exp/chain/tdnn/decode_test/log/decode.1.log >> exp/chain/tdnn/decode_test/log/decode.1.log
run.pl: job failed, log is in exp/chain/tdnn/decode_test/log/decode.1.log

  备注:因运行该模型要求的最小内存为64G,因此在低于64G的情况下会被直接Kill掉!

  3.参考别人的执行结果

   

  

原文地址:https://www.cnblogs.com/yszd/p/12192769.html