kenlm的使用

1.训练模型

install_path/bin/lmplz -o 3 -S 80% -T /temp <text >text.arpa

2.查询模型

为了更快的加载将 text.arpa 转换为 binary 文件

install_path/bin/build_binary text.arpa text.binary

测试

install_path/bin/query text.binary <test.txt >result.txt

结果如下图所示，输出每个句子的混淆度和未登录词，以及整个测试语料的混淆度和未登录词。