Android O new TextToSpeech onRangeStart() callback



TTS UtteranceProgressListener 的新回调函数 onRangeStart() 将允许我们突出显示较长短语的单个单词,因为它是由 TTS 引擎朗读的。回调是在 Android API 参考中定义的 https://developer.android.com/reference/android/speech/tts/UtteranceProgressListener.html#onRangeStart(java.lang.String, int, int, int),但是当应用程序将短语(例如句子)发送到 TTS 引擎进行语音生成时,我在任何地方都找不到有关如何实际定义短语范围的信息。

这些"范围"到底是什么,如何定义它们?或者它们是预先定义为"单词"或用空格分隔的任何内容?

更多信息:我使用了Android O模拟器,并在TTS应用程序中创建了onRangeStart()回调,使用了来自Google TTS设置的不同声音,以查看是否自动定义了任何范围,并且回调将被调用。无。也许必须在 speak() 调用的"参数"捆绑包中以某种方式定义范围???

谷歌仍然没有记录这个功能,对他们的跟踪器中提交的问题的最新回应是"我们已经推迟到未来的版本,但暂时保持开放。

同时,通过在我的TTS应用程序中实现onRangeStart()回调并使其显示调试输出,我看到"范围"只是单词。当仅使用来自谷歌 TTS 的英语语音时,我看到此回调命中,到目前为止,没有来自谷歌或其他公司的其他 TTS 语音实现这一点。例如,大声朗读一个句子:"这是一个要大声朗读的句子"会在 onRangeStart() 中产生以下输出:

onRangeStart(avar-1) start=0, end=4, frame=275         (This)
onRangeStart(avar-1) start=5, end=7, frame=3575        (is)
onRangeStart(avar-1) start=8, end=9, frame=6270        (a)
onRangeStart(avar-1) start=10, end=18, frame=7810      (sentence)
onRangeStart(avar-1) start=19, end=21, frame=18535     (to)
onRangeStart(avar-1) start=22, end=26, frame=21285     (read)
onRangeStart(avar-1) start=27, end=32, frame=25795     (aloud)

如果谷歌的某个人正式告诉我们"范围"只是单词,至少目前是这样,那将是有帮助的。

相关内容

  • 没有找到相关文章

最新更新