小贝子编程

如何从扬声器输出实时将语音转换为文本

本文关键字：语音转换文本实时扬声器输出 azure-cognitive-services
更新时间 : 2023-09-15
英文 : how to convert speech to text realtime from speaker output

我正在尝试从麦克风和扬声器输出实时转换语音。目前，我正在尝试将两个扬声器的通话记录到wav文件中，并将其发送到Cognitive SDK进行转换。

有没有一种方法可以使用认知sdk转换扬声器设备的输出。链接到任何样本都会很有帮助。

请尝试使用Microsoft Bing Speech API。生成密钥并将其集成到您的网页上，它将实时将语音转换为文本。

https://azure.microsoft.com/en-in/services/cognitive-services/directory/speech/

最新更新

尽管有"max-size"命令，但 docker-compose 未轮换失控的 docker 日志
使用元组作为索引来比较列表中的项
如何修复"javax.crypto.IllegalBlockSizeException: Input length must be multiple of 16 when decrypting wit
c -使用中断或线程和全局变量进行优化
Html语言中带有fetch方法的Onclick回调
如何调试SQL Server 2018中的存储过程
如何修复我的代码从serial1接收数据并按下一个值并将其发送到serial0，同时运行步进电机 &
CentOS安装R包RLumShiny失败
解析字符串以创建几何图形
restorePreviousSignIn()在GIDSignIn-iOS SDK V6.0.2到期时不获取新的idTo
从Nodejs发送的错误请求-原始消息缺少头部信息
Oracle 将今天的值传递给变量并使用它
r语言 - 是否有可能把3D网格和arc3d对象在同一个rgl窗口，同时允许单独旋转?
依次递增的号码，如123 + 123 = 123123
SQL:如何使用参数变量重命名标题?
在Shopify中隐藏折扣代码输入字段
无法导入外部 NPM 包来制作角度库
掩码输入字段的长度验证
用点分隔符分隔列
在Mac上将Xerces库构建为通用二进制文件的问题
在同级组件之间使用共享服务共享数据，在Angular中返回空
为什么我的 C 结构在输入中没有获取任何数据？
org.keycloak.adapters.springboot.KeycloakSpringBootConfigResolver 不存在
为一个非常大的数据库优化SPARQL查询
Python线程请求计数
将结果保存为pyspark多输出循环中的数据帧
这两个数组的区别是什么?
如何在主线程上运行async await
React Native FlatList ListEmptyComponent总是显示，即使不是空的
Android Emulator未在M1上运行

如何从扬声器输出实时将语音转换为文本

相关内容

最新更新

热门标签：