我试图在Sklearn中倾斜SVM模型的SVC分类器。我已经学会了在各种数据集上使用它,甚至应用了GridSearch来改善结果,但我尚未了解某些参数,例如C,伽马。
如果任何人都可以简单但细节地说明每个参数,那将很棒。
由于我们试图最大程度地减少目标函数,因此我们可以将系数向量本身的一些'大小'度量添加到函数中。C本质上是"正则化"项上重量的倒数。减小C将通过迫使系数稀疏或小,具体取决于罚款,可以防止过度适应。c增加过多将促进不足的效果。
伽马是RBF内核的参数。增加伽玛可以建立更复杂的决策边界(这可能导致过度拟合,但也可以改善结果 - 这取决于数据)。
此Scikit-Learn教程以图形方式显示了更改两个超参数的效果。