我训练了500台设备的数据来预测它们的性能。然后,我将训练好的模型应用到另外500台设备的测试数据集上,并显示出相当好的预测结果。现在我的主管们想让我证明这种模式可以在100万台设备上运行良好,而不仅仅是500台。显然,我们没有100万台设备的数据。如果模型不可靠,他们希望我找到所需的训练数据量,以便在一百万台设备上做出可靠的预测。我该如何与这些没有统计分析和建模背景的高管打交道?有什么建议吗?由于
我建议@cep写下他的评论作为答案-包括提供variance
和bias
的计算。在任何情况下都可以加上
"不要草率地认为高管们根本没有能力。技术或数学概念"
虽然可能有Dilbert
管理器在那里…某处我自己也见过一些。通常情况下,管理者是通过努力工作获得职位的。他们可能会生疏,但能力可能还在。
在这种情况下,无论他们是否有"统计分析和建模的背景",他们都是在运用常识。
您可能要做的第一件事是提供适当的上下文和术语。@cel已经提到了其中的一些:为:
提供具体值- 假设
- 你对数据做了什么假设。
- 有什么依据来考虑有限数据的外推
- 为什么要相信外推的结果适用于99.5%的未经测试的数据
- 数据分布
- 基本描述性统计
- 您对数据的先验分布的看法。说明你为什么选择它
- 建模
- 考虑了哪些模型/方法以及为什么
- 您实际选择的模型和原因
- 你是怎么得到超参数的
- 你如何训练模型
- 搜索结果
- 拟合和错误率的统计测量