我正在sci-kit learn中使用Ridge回归函数。
有一个交叉验证函数RidgeCV。基本(示例)设置为:
RidgeCV(alphas=[0.1, 1.0, 10.0], cv=None, fit_intercept=True, scoring=None,
normalize=False,store_cv_values=True)
比方说我想做一份10倍的简历。我是不是用"CV="这个参数设置的?我看到的每个RidgeCV都将cv设置为cv=None。
1) 甚至不确定这是设置10倍的正确位置。
2) 在文档中找不到除"无"之外的其他CV=参数值。
感谢
如果设置cv=None
,则RidgeCV
将使用"广义交叉验证"公式执行留一交叉验证,该分析公式将为您提供一岭回归计算成本的留一误差。
如果您想使用其他交叉验证方案,您可以:只需从sklearn.cross_validation
导入它们。例如
from sklearn.cross_validation import KFold, ShuffleSplit
cv1 = KFold(n_samples, k=10)
cv2 = ShuffleSplit(n_samples, test_size=.2, n_iter=20)
然后可以将这些迭代器作为cv=...
传递。如果将cv
设置为数字,例如cv=5
,则默认为KFold(n_samples, k=5)
交叉验证。