返回模式有流式(streaming)和整体(total) 热词词表解决方案

重要术语说明_语音识别(ASR)_智能语音交互-阿里云  https://help.aliyun.com/document_detail/72238.html

返回模式(response mode)

在调用语音识别服务时进行设置,返回模式有流式(streaming)和整体(total)两个选项。

  • “整体”模式只在语音全部识别完后返回一次完整的结果
  • “流式”模式下用户一边说话一边返回识别结果,其中除了最后一次是完整的结果,其余的都是中间结果

比如语音是“你好阿里巴巴”,“整体”模式只在用户说完后返回一次最终结果“你好阿里巴巴”;而“流式”可能如下面所列在用户说话的同时返回5次。

  1. 你好
  2. 你好啊
  3. 你好阿里
  4. 你好阿里巴巴

注意:

  • 中间结果可能在后续返回结果中被修正,如“你好啊” -> “你好阿里”
  • 每次中间结果增量返回的字数并不固定,并不是每次都比上一次多识别一个字,如“你好阿里”->“你好阿里巴巴”

热词词表(vocabulary)

智能语音识别服务支持用户自定义热词功能,用户可以上传热词词表(vocabulary),得到词表id。在调用语音识别服务时设置vocabulary_id字段,即使用该词表,将会提高该词表中的热词的识别率。

原文地址:https://www.cnblogs.com/rsapaper/p/9133199.html