机器学习-将训练数据转换到另一个空间，这样我们就可以找到超平面

我想知道我们如何知道将数据转换成什么空间?用什么方法找到合适的映射函数?

假设我们在二维空间中有10个不可线性分离的训练案例，但如果我们将它们从F(X,Y): (X,Y) -> (X,Y ^2)或G:(X, Y) -> (X, e^ Y)进行变换，它们是线性可分离的。

我们如何确定函数F和G首先会起作用?通过观察吗?然后我们怎么决定用哪个函数呢?

SVM通过核函数的方式映射到不同的空间。因此，要训练支持向量机，您不需要将数据映射到线性可分的位置，只需用适当的(非线性)核训练支持向量机。它可以学习线性不可分的函数，只要有正确的核。尝试rbf，以及多项式核。还可以使用C超参数。

这可能不是你想要的答案，但很多机器学习都是尝试一下。在这种情况下，多项式核似乎适合您的状态，但rbf往往工作得更好。

"我们如何确定函数F和G首先会起作用?"通过观察吗?"

差不多……目前，据我所知，没有已知的条件可以保证映射后的线性可分性。

"那么我们如何决定使用哪个函数呢?"

一些函数比其他函数更容易调整。例如，rbf非常适合，并且已知适合大多数数据。，但任何东西都有一个陷阱，所以如果你的数据是无界的，你就会失去一般性。所以这是一个权衡的问题

相关内容