我正在做多类分类并在其上应用逻辑回归
当我调用
拟合数据时logistic.fit(InputDATA,OutputDATA)
估计器"logistic "拟合数据。
现在当我调用logistic.coef_
时,它打印一个2D数组有4行(我有四个类)和n列(每个特征一个)
这是我在SCIKIT学习网站上看到的:
coef_: array, shape (n_features,) or (n_targets, n_features)线性回归问题的估计系数。如果多个目标在拟合期间传递(y 2D),这是一个二维形状数组(n_targets, n_features),而如果只传递一个目标,则这是一个长度为n_features.
的1D数组
现在我的查询是:为什么不同的类别有不同的系数,因为我只需要一个可以预测输出的假设。
当您有一个多类情况(>2个情况)时,应用一个对一个的策略。Sklearn创建了4个分类器,而不是1个。因此你有4个假设和4个系数。
注意:我对逻辑回归分类器没有任何线索,但这就是sklearn SVM的工作方式。
根据L1或L2正则化得到输入特征的系数。如果你不指定L1或L2, L2将被模型假设。您可以将这些系数用于模型优化或特征工程