我有一个角度应用程序,我想在其中将机器人与对话流NLP集成。因此,我想将语音识别功能集成到机器人中。我正在尝试使用 Google Cloud Speech API 或 Azure 认知服务 Speech to Text API。由于文档仅针对两个 API 的服务器端提供。任何人都可以建议以角度或任何其他方式集成该 API 中的任何一个的方法,以提供除 Web 语音 API 之外的角度应用程序的语音输入和输出能力。
我不能代表Google Cloud,但对于Azure来说,在服务器端进行连接的原因是控制对Azure服务的访问。如果对 Azure 客户端进行身份验证,这意味着用户可以使用该身份验证对服务执行任何他们想要的操作,而你仍需支付账单。情况不好。
实现这一点的正确方法是使用后端作为中间人。用户向后端进行身份验证,然后后端向认知服务进行身份验证。虽然这是一个额外的步骤,但您的用户永远无法直接访问 API 端点。由于安全问题,这是一种常见模式,而不仅仅是认知服务。
如果您了解这是一个严重的风险,并且仍然想使用 Angular 应用程序,请查看 Node 示例。虽然这些仍然是服务器端示例,但它将非常接近您在 Angular 中的实现方式。