我必须创建一个带有RBF核和硬边界的svm分类器。如果我打得正确,保证金的种类由C参数控制。也就是说,C参数越大,我得到的硬边值就越多。是否有一个典型的C值模拟了一个非常健壮的"硬余量"?或者有没有其他方法可以效仿强大的硬边界?当然,我们总是可以讨论为什么我们需要效仿硬优势。但在这种情况下,我需要效仿它!
clf = svm.SVC(C = ??,kernel="rbf",gamma =1.5,shrinking=False,cache_size=3000)
通常不需要那么大的值,但通常情况下就是这样。只需尝试将其设置为1e10,然后查看生成的字母。
如果没有一个字母处于C值,则不应用正则化(即,在训练集=硬边值中所有点都被正确分类)。
顺便说一句,如果你的数据集非常嘈杂,并且无法与你正在使用的内核分离,那么你就无法实现硬边界。