我喜欢Google Speech to Text API的一点是,它具有出色的准确性,根据我的经验,它比Azure API好得多。原因是,我能够在请求中向Google API发送预期单词列表,从而增加这些术语/短语发生的可能性。使用 Azure,我只能制作语音模型。这样做的问题是,我必须为每个请求创建一个新模型,因为每个请求都会有一个与其他请求不同的词汇等。这些请求不是特定于行业的,它们是完全随机的。
因此,我的问题是,我是否可以将预期单词列表与我的请求一起发送到 Azure API?
干杯
你解决了你的问题吗?
关于 Azure,需要首先收集与问题和行业相关的训练数据。然后,在此数据集上训练一个模型,并在生产中使用此模型转录音频。
您不会在每次有新请求时都训练一个模型。