使用默认参数进行decisiontree
回归时,我得到R2值"-1.3"。这意味着什么,我的模型可以吗?均方误差也是不合理的。我可以通过更改分类器的参数来使其为正数吗。
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score.html
from sklearn.metrics import r2_score, mean_squared_error
负R2表示过度拟合,这对于未经调整的决策树来说非常典型,适合小的或有噪声的训练数据。
您可以通过调整决策树的参数来解决这个问题,例如使用网格搜索——将max_depth
设置为较小的值可能会使模型在您的情况下表现更好。
一个更好的方法是改用随机森林模型,该模型使用决策树集合来更自动地校正这种过度拟合(尽管通过网格搜索进行调整对于进一步优化结果仍然很重要)。