通用文本到语音转换语音



是否存在(或可能存在(通用TTS语音,即与某种语言(例如英语或德语(无关的声音?

我正在寻找一种以相同声音阅读不同国家/地区的街道名称的方法。

目前,没有(我知道,或者出现了搜索(。

这是因为大多数高质量的TTS引擎都依赖于播放预先录制的单词。对于这样的TTS来说,在所有语言中都以相同的声音说话,这意味着同一个人用所有这些语言录制了他/她的声音。今天大约有6500种语言,用一种语言记录字典大约需要一个月的时间。因此,要记录所有语言,需要541年。那个人到那时早就死了。请注意,这是夸张的:对于一个体面的 TTS,不需要逐字记录字典。

要做到这一点,需要的是完全由计算机生成的语音。然而,即使这样也被分成方言,因为法语强调不同的字母,然后说西班牙语。如果不是,那么你可能有一个说Fringlish的TTS引擎。

鉴于您在不同国家/地区的街道名称,最好的解决方案是使用 espeak。它内置了很多语言,听起来总是一样:机器人和没有情感。它可以通过命令行调用,因此几乎可以在任何编程语言中使用。

如果你知道这条街在哪个国家,你可以有一个数据库,里面有他们在不同国家说什么语言。我曾经为此使用过geonames数据库,它运行良好。然后,你可以用你想说的文本和语言来调用epeak。Geonames 提供每日转储,您可以下载和提取语言。然后,您可以将庞大的数据库存储在服务器上,例如Dotcloud。或者,您可以使用他们的 API,但每天只能使用 30,000 次。

如果您不知道街道所在的国家/地区是什么语言,则可以采用更粗略的方法,这并不总是有效的。语言检测。由于大多数街道名称在不同国家/地区都是真实单词,例如"主街",因此您可以运行语言检测,并找出以这种方式使用哪种语言。我听说 detectlanguage.com 对此有好处。

因此,虽然没有现成的方法,但您可以自己制作一个,而不会有太多麻烦。

最新更新