Try edu.cmu.sphinx.pocketsphinx with processRaw 来检测沉默。
使用以下配置:
en-us.lm.bin语言模型
EN-US-PTM 声学模型
cmudict-en-us.dict dictionary
还将remove_noise设置为 True 并将 samprate 设置为 8000
我想做一个Ngram搜索。
当 While 循环调用进程原始完成时,我调用两者
hypothesis.getHypstr(( 和
decoder.getInSpeech((
为什么getHypstr返回空,而getInSpeech返回True,而实际上在给processRaw的输入参数中没有语音。
谢谢。
En-us-ptm 是 16kHz 型号,它不适用于采样率 8000。这会导致 hypstr 的不良结果。
如果getInSpeech返回true,则可能意味着系统接受为语音的小噪音。