我在尝试对包含 30.000 个文本的数据集执行内核 PCA 时遇到内存错误。随机PCA工作正常。我认为正在发生的事情是随机PCA适用于稀疏数组,而KernelPCA则不然。
有没有人有当前在scikits-learn中使用稀疏数组支持实现的学习方法列表?
我们还没有。您现在必须阅读各个类的文档字符串。
无论如何,对于文本文档等高暗稀疏数据,非线性模型往往并不比线性模型更好(而且它们更容易过度拟合)。
我在尝试对包含 30.000 个文本的数据集执行内核 PCA 时遇到内存错误。随机PCA工作正常。我认为正在发生的事情是随机PCA适用于稀疏数组,而KernelPCA则不然。
有没有人有当前在scikits-learn中使用稀疏数组支持实现的学习方法列表?
我们还没有。您现在必须阅读各个类的文档字符串。
无论如何,对于文本文档等高暗稀疏数据,非线性模型往往并不比线性模型更好(而且它们更容易过度拟合)。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium