我正在尝试实现我自己的家庭自动化基础设施,目前我能够与一些自制设备进行语音交互,流程如下:
声音=比;GooogleHomeDevice→IFTTT.COM-Applet→IO.ADAFRUIT.COM-Feed→ESP32 (MQTT) =比;设备
由于IFTTT/IO的一些限制。ADAFRUIT节点,我想切换到这种流:
声音=比;GooogleHomeDevice→()→GC-Functions→GC-PubSub→ESP32 (MQTT) =比;设备
我需要的(东西)是一个功能,允许我提供一个谷歌云功能与我的语音命令在文本格式,使GCF使它们可用于另一个服务(GC PubSub),同样的方式ifttt.com applet做io.adafruit.com饲料。
IFTTT.COM服务执行任务的方式看起来相当简单,因为它只需要"使用我的谷歌账户拦截我的互动(我知道很多东西可以隐藏在幕后)。
我一直在寻找替代解决方案,但到目前为止,我发现的所有内容都涉及许多组件的复杂交互(Google Assistant, Actions on Google, Firebase,…)。
在我开始构建如此复杂的东西之前,我想知道唯一的"简单任务"是如何完成的。可以实现捕获我的声音命令(可能不使用GCP以外的功能)。
谢谢。
捕获语音命令的另一种解决方案是使用带有命令和搜索模型的语音到文本API(该模型专门用于转录较短的音频片段),并将single_utterance设置为true
。
参见示例用例图