sklearn.metrics的尴尬结果

使用默认参数进行decisiontree回归时，我得到R2值"-1.3"。这意味着什么，我的模型可以吗？均方误差也是不合理的。我可以通过更改分类器的参数来使其为正数吗。

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score.html

from sklearn.metrics import r2_score, mean_squared_error

负R2表示过度拟合，这对于未经调整的决策树来说非常典型，适合小的或有噪声的训练数据。

您可以通过调整决策树的参数来解决这个问题，例如使用网格搜索——将max_depth设置为较小的值可能会使模型在您的情况下表现更好。

一个更好的方法是改用随机森林模型，该模型使用决策树集合来更自动地校正这种过度拟合（尽管通过网格搜索进行调整对于进一步优化结果仍然很重要）。

相关内容