TTS UtteranceProgressListener 的新回调函数 onRangeStart() 将允许我们突出显示较长短语的单个单词,因为它是由 TTS 引擎朗读的。回调是在 Android API 参考中定义的 https://developer.android.com/reference/android/speech/tts/UtteranceProgressListener.html#onRangeStart(java.lang.String, int, int, int),但是当应用程序将短语(例如句子)发送到 TTS 引擎进行语音生成时,我在任何地方都找不到有关如何实际定义短语范围的信息。
这些"范围"到底是什么,如何定义它们?或者它们是预先定义为"单词"或用空格分隔的任何内容?
更多信息:我使用了Android O模拟器,并在TTS应用程序中创建了onRangeStart()回调,使用了来自Google TTS设置的不同声音,以查看是否自动定义了任何范围,并且回调将被调用。无。也许必须在 speak() 调用的"参数"捆绑包中以某种方式定义范围???
谷歌仍然没有记录这个功能,对他们的跟踪器中提交的问题的最新回应是"我们已经推迟到未来的版本,但暂时保持开放。
同时,通过在我的TTS应用程序中实现onRangeStart()回调并使其显示调试输出,我看到"范围"只是单词。当仅使用来自谷歌 TTS 的英语语音时,我看到此回调命中,到目前为止,没有来自谷歌或其他公司的其他 TTS 语音实现这一点。例如,大声朗读一个句子:"这是一个要大声朗读的句子"会在 onRangeStart() 中产生以下输出:
onRangeStart(avar-1) start=0, end=4, frame=275 (This) onRangeStart(avar-1) start=5, end=7, frame=3575 (is) onRangeStart(avar-1) start=8, end=9, frame=6270 (a) onRangeStart(avar-1) start=10, end=18, frame=7810 (sentence) onRangeStart(avar-1) start=19, end=21, frame=18535 (to) onRangeStart(avar-1) start=22, end=26, frame=21285 (read) onRangeStart(avar-1) start=27, end=32, frame=25795 (aloud)
如果谷歌的某个人正式告诉我们"范围"只是单词,至少目前是这样,那将是有帮助的。