我想使用scikit-learn对自定义核支持向量机进行交叉验证的网格搜索。更准确地说,按照这个例子我想定义一个像
这样的核函数def my_kernel(x, y):
"""
We create a custom kernel:
k(x, y) = x * M *y.T
"""
return np.dot(np.dot(x, M), y.T)
,其中M是核函数的一个参数(就像高斯核函数中的伽马)。
我想通过GridSearchCV输入参数M,类似于
parameters = {'kernel':('my_kernel'), 'C':[1, 10], 'M':[M1,M2]}
svr = svm.SVC()
clf = grid_search.GridSearchCV(svr, parameters)
所以我的问题是:如何定义my_kernel,使M变量将由GridSearchCV给出?
您可能必须创建一个包装器类。比如:
class MySVC(BaseEstimator,ClassifierMixin):
def __init__( self,
# all the SVC attributes
M ):
self.M = M
# etc...
def fit( self, X, y ):
kernel = lambda x,y : np.dot(np.dot(x,M),y.T)
self.svc_ = SVC( kernel=kernel, # the other parameters )
return self.svc_.fit( X, y )
def predict( self, X ):
return self.svc_.predict( X )
# et cetera