小贝子编程

将说话者注释(比如id、name)添加到云语音到文本api中，并将其包含在云语音到文字api生成的输出json中

本文关键字：语音 api 包含输出 json 文字文本比如注释说话者 id google-cloud-platform
更新时间 : 2023-09-22
英文 : Add speaker annotation (say id, name) to cloud-speech-to-text api and get it included in the output json produced by the cloud-speech-to-text api

谷歌云平台的云语音到文本api将多个扬声器的音频转换为文本。它返回一个JSON输出，其中包括谁在什么时候说了什么。但说话者识别(世界卫生组织(是匿名的。有没有一种方法可以注释或给出关于说话者的输入(比如id、name(，并将其包含在api生成的输出JSON中？

根据谷歌文档，没有办法将说话者信息输入到云语音到文本api。

如您所知，Speaker diarization函数仅通过speakerTag值处的数字来区分Speaker。

"words": [
{
"startTime": "0s",
"endTime": "1.100s",
"word": "hi",
"speakerTag": 2
},
{
"startTime": "1.100s",
"endTime": "2s",
"word": "I'd",
"speakerTag": 2
}

我认为唯一可以解决的方法是手动修改JSON输出的Speakertag值。

将说话者注释(比如id、name)添加到云语音到文本api中，并将其包含在云语音到文字api生成的输出json中

相关内容

最新更新

热门标签：