Microsoft语音识别结果的格式设置(挪威语)



在我们正在进行的使用各种语音转文本供应商转录视频材料的实验中,Microsoft似乎是实际单词识别的有力竞争者。对于英语材料,格式/标点符号也相当不错,但对于挪威语材料(与我们最相关(,几乎没有任何格式/标点符号。我们正在使用带有配置的 C# API 语音识别器。语音识别语言设置为"nb-NO",配置。OutputFormat 设置为 OutputFormat.Detailed,并使用 config。RequestWordLevelTimestamps((.我们可以做些什么来改进结果的格式?

此外,在检索带有时间戳的单个单词(这是我们的要求之一(时,即使使用英文材料也没有格式。在检索单个单词时,是否可以设置一些选项来保持格式/标点符号?

此致敬意 贡纳尔

Microsoft对nb-NO结果的语音格式化支持目前确实非常基本。显示结果具有基本的数字格式和明确的标点符号(当请求(。Microsoft Speech正在积极致力于改进自动标点符号和大写以改善结果。 关于时间戳,目前它不生成显示级别的时间戳。将来可能会支持它。

最新更新