我正在研究自动语音识别系统的端到端架构。
RNN换能器(RNN-T(是目前流行的端到端方法之一,但其训练难度很大。
因此,我正在寻找一个框架或工具包,它可以帮助我轻松地实现基线模型,然后根据我的意愿进行修改。
提前感谢!
对于那些感兴趣的人,我目前正在使用ESPnet工具包,该工具包主要专注于端到端语音识别和端到端文本到语音。
我正在研究自动语音识别系统的端到端架构。
RNN换能器(RNN-T(是目前流行的端到端方法之一,但其训练难度很大。
因此,我正在寻找一个框架或工具包,它可以帮助我轻松地实现基线模型,然后根据我的意愿进行修改。
提前感谢!
对于那些感兴趣的人,我目前正在使用ESPnet工具包,该工具包主要专注于端到端语音识别和端到端文本到语音。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium