是一些数据集只是没有预测的

某些类型的数据集不是预测的吗？

当前的现实生活示例：我的目标是为交叉销售保险产品创建预测模型。例如。健康保险的汽车保险。

我的数据集主要由特征数据组成，例如它们所处的状态，年龄，性别，汽车类型等...

我尝试过各种不同的模型，例如XGBOOSTERTER，以进行正规的逻辑回归，而AUC无法超过.65。

这样，这会导致我 - 某些类型的数据集是否无法预测？您如何帮助利益相关者理解这一点？

某些数据集可能不是很好的预测性。特别是如果您缺少占大部分差异的变量。如果没有与主题专家交谈，很难说是这种情况。话虽如此，模型很好，但是我还将确保您花费大量的时间工程功能。通常，代表数据的时间正确可能是工作模型和不良模型之间的区别，尤其是在树模型中。

相关内容