在谷歌助理或基于python的音频聊天机器人程序中合并运动传感器和声音文件更好吗?



我想在音频聊天机器人中加入一些新的东西。 我可以检查一下最好的方法吗? - 我想录制演员的声音以替换聊天机器人的默认计算机化声音 - 我想包含按需播放的声音文件(并且种类繁多,因此播放的文件取决于用户的选择( - 这可能吗,如果是这样,在开始播放之前会有很多延迟吗? - 我还想使用传感器运动来启动程序,以便聊天机器人在用户进入房间时自动打招呼并开始对话,而不是用户必须说"你好谷歌,我可以和...等等'激活聊天机器人。

  • 到目前为止,我一直在使用对话流来构建自然语言处理聊天机器人。 对话流是否有能力完成所有这些操作,或者我也应该使用链接到它的另一个程序? 或者,对于这种功能,使用 python 构建聊天机器人会更好 - 有人知道任何开源版本吗?

如果没有用户说"好的,谷歌。与.."。这样做是为了在没有用户自己激活的情况下无法触发 Google 助理。

至于使用声音文件,您可以录制部分对话并使用 SSML 在对话中使用这些文件。使用 SSML,您可以使用简单的代码编辑助手所说的内容。音频标签是播放声音文件所需的标签。

最新更新