r语言 - 如何处理线性模型中没有变异性(即天花板底面效应)的预测变量?



我想测试线性模型中 4 个数值预测变量对 DV 的影响,但是其中一个预测变量没有可变性(即天花板效应(。我应该删除它还是使用专门的线性模型?

这可能是一个更适合交叉验证、统计或 DS 的问题,因为它主要不是关于编码的。

尽管如此,我可以为你指出正确的方向。

首先,这取决于变量的确切性质。你说这不是可变性/方差,这意味着它是恒定的。假设你的DV不是恒定的,显然没有相关性或影响,变量可以删除,因为它没有影响(例如,如果我所有的测试对象都是男性,是一个无用的测试变量,不会预测任何东西(。

但是,如果您只是说它具有很小的方差或受某个下限或上限阈值(例如,永远不会超过X(的约束,那就不同了。

对此的最佳答案始终是计算多个模型并简单地进行比较。

如果包含所有变量的模型比删除特定变量的模型更好,那么保留它当然是有价值的。使用 r² 和预测变量的显著性来跟踪它,并记住,即使变量本身不能预测 DV,它也可以用作抑制变量。

最后是关于模型选择。您已经假设预测变量和 DV 的关系是线性的,但也许这不是真的,或者至少不是对所有变量都是如此。你可以测试这个假设并从那里开始工作。但是线性模型之间的切换不太可能影响结果,在检测几乎恒定的预测变量和DV之间的关系方面,没有线性模型比另一个更好。

相关内容

  • 没有找到相关文章

最新更新