机器学习-将训练数据转换到另一个空间,这样我们就可以找到超平面



我想知道我们如何知道将数据转换成什么空间?用什么方法找到合适的映射函数?

假设我们在二维空间中有10个不可线性分离的训练案例,但如果我们将它们从F(X,Y): (X,Y) -> (X,Y ^2)或G:(X, Y) -> (X, e^ Y)进行变换,它们是线性可分离的。

我们如何确定函数F和G首先会起作用?通过观察吗?然后我们怎么决定用哪个函数呢?

SVM通过核函数的方式映射到不同的空间。因此,要训练支持向量机,您不需要将数据映射到线性可分的位置,只需用适当的(非线性)核训练支持向量机。它可以学习线性不可分的函数,只要有正确的核。尝试rbf,以及多项式核。还可以使用C超参数。

这可能不是你想要的答案,但很多机器学习都是尝试一下。在这种情况下,多项式核似乎适合您的状态,但rbf往往工作得更好。

"我们如何确定函数F和G首先会起作用?"通过观察吗?"

差不多……目前,据我所知,没有已知的条件可以保证映射后的线性可分性。

"那么我们如何决定使用哪个函数呢?"

一些函数比其他函数更容易调整。例如,rbf非常适合,并且已知适合大多数数据。,但任何东西都有一个陷阱,所以如果你的数据是无界的,你就会失去一般性。所以这是一个权衡的问题

相关内容

最新更新