机器学习——如何向高管证明预测模型的可靠性



我训练了500台设备的数据来预测它们的性能。然后,我将训练好的模型应用到另外500台设备的测试数据集上,并显示出相当好的预测结果。现在我的主管们想让我证明这种模式可以在100万台设备上运行良好,而不仅仅是500台。显然,我们没有100万台设备的数据。如果模型不可靠,他们希望我找到所需的训练数据量,以便在一百万台设备上做出可靠的预测。我该如何与这些没有统计分析和建模背景的高管打交道?有什么建议吗?由于

我建议@cep写下他的评论作为答案-包括提供variancebias的计算。在任何情况下都可以加上

"不要草率地认为高管们根本没有能力。技术或数学概念"

虽然可能有Dilbert管理器在那里…某处我自己也见过一些。通常情况下,管理者是通过努力工作获得职位的。他们可能会生疏,但能力可能还在。

在这种情况下,无论他们是否有"统计分析和建模的背景",他们都是在运用常识。

您可能要做的第一件事是提供适当的上下文和术语。@cel已经提到了其中的一些:为:

提供具体值
  • 假设
    • 你对数据做了什么假设。
    • 有什么依据来考虑有限数据的外推
    • 为什么要相信外推的结果适用于99.5%的未经测试的数据
  • 数据分布
    • 基本描述性统计
    • 您对数据的先验分布的看法。说明你为什么选择它
  • 建模
    • 考虑了哪些模型/方法以及为什么
    • 您实际选择的模型和原因
    • 你是怎么得到超参数的
    • 你如何训练模型
  • 搜索结果
    • 拟合和错误率的统计测量

相关内容

  • 没有找到相关文章

最新更新