通用文本到语音转换语音

是否存在(或可能存在(通用TTS语音，即与某种语言(例如英语或德语(无关的声音？

我正在寻找一种以相同声音阅读不同国家/地区的街道名称的方法。

目前，没有(我知道，或者出现了搜索(。

这是因为大多数高质量的TTS引擎都依赖于播放预先录制的单词。对于这样的TTS来说，在所有语言中都以相同的声音说话，这意味着同一个人用所有这些语言录制了他/她的声音。今天大约有6500种语言，用一种语言记录字典大约需要一个月的时间。因此，要记录所有语言，需要541年。那个人到那时早就死了。请注意，这是夸张的：对于一个体面的 TTS，不需要逐字记录字典。

要做到这一点，需要的是完全由计算机生成的语音。然而，即使这样也被分成方言，因为法语强调不同的字母，然后说西班牙语。如果不是，那么你可能有一个说Fringlish的TTS引擎。

鉴于您在不同国家/地区的街道名称，最好的解决方案是使用 espeak。它内置了很多语言，听起来总是一样：机器人和没有情感。它可以通过命令行调用，因此几乎可以在任何编程语言中使用。

如果你知道这条街在哪个国家，你可以有一个数据库，里面有他们在不同国家说什么语言。我曾经为此使用过geonames数据库，它运行良好。然后，你可以用你想说的文本和语言来调用epeak。Geonames 提供每日转储，您可以下载和提取语言。然后，您可以将庞大的数据库存储在服务器上，例如Dotcloud。或者，您可以使用他们的 API，但每天只能使用 30,000 次。

如果您不知道街道所在的国家/地区是什么语言，则可以采用更粗略的方法，这并不总是有效的。语言检测。由于大多数街道名称在不同国家/地区都是真实单词，例如"主街"，因此您可以运行语言检测，并找出以这种方式使用哪种语言。我听说 detectlanguage.com 对此有好处。

因此，虽然没有现成的方法，但您可以自己制作一个，而不会有太多麻烦。

相关内容

最新更新

热门标签：