我想知道两个不同分类器的超参数之间是否存在某种相关性。
例如:假设我们在具有最佳超参数的数据集上运行LogisticRegression
(通过GridSearch
查找),并希望在同一数据集上运行另一个分类器,如SVC
(SVM
分类器),但不使用GridSearch
查找所有超参数,我们可以修复超参数的一些值(或缩小范围以限制GridSearch
的搜索空间)超参数吗?
作为实验,我使用scikit-learn
的分类器,如LogisticRegression
、SVS
、LinearSVC
、SGDClassifier
和Perceptron
来分类一些众所周知的数据集。在某些情况下,我能够凭经验看到一些相关性,但并非总是适用于所有数据集。
所以请帮我澄清这一点。
我认为你不能像这样将不同分类器的不同参数关联在一起。这主要是因为每个分类器的行为不同,因为它有自己的方式来按照自己的方程集调整数据。例如,以具有两个不同内核rbf
和sigmoid
的SVC
为例。可能是rbf
可以完美地适合数据,intercept parameter C
设置为 0.001,而"sigmoidkernel over the same data may fit with
C"值为 0.00001。这两个值也可能相等。但是,您永远无法肯定地说。当你说:
在某些情况下,我能够凭经验看到一些相关性,但并非总是适用于所有数据集。
这可能只是一个巧合。因为这完全取决于 和 分类器。您不能全局应用它。相关性并不总是等于因果关系
您可以访问此站点,亲眼看看尽管不同的回归函数具有相同的参数a
,但它们的方程却大不相同,因此在相同的数据集上,您可能会a
值大不相同。