是一些数据集只是没有预测的



某些类型的数据集不是预测的吗?

当前的现实生活示例:我的目标是为交叉销售保险产品创建预测模型。例如。健康保险的汽车保险。

我的数据集主要由特征数据组成,例如它们所处的状态,年龄,性别,汽车类型等...

我尝试过各种不同的模型,例如XGBOOSTERTER,以进行正规的逻辑回归,而AUC无法超过.65。


这样,这会导致我 - 某些类型的数据集是否无法预测?您如何帮助利益相关者理解这一点?

某些数据集可能不是很好的预测性。特别是如果您缺少占大部分差异的变量。如果没有与主题专家交谈,很难说是这种情况。话虽如此,模型很好,但是我还将确保您花费大量的时间工程功能。通常,代表数据的时间正确可能是工作模型和不良模型之间的区别,尤其是在树模型中。

最新更新