r-线性模型中的类别预测因子是否应该是正态分布的



我在R中运行简单的线性模型(Y~X),其中我的预测器是一个分类变量(0-10)。然而,这个变量不是正态分布的,并且没有任何可用的转换技术是有益的(例如log、sq等),因为数据不是负/正偏斜的,而是到处都是。我知道lm的结果变量(Y)必须是正态分布的,但预测因子也需要这样吗?如果是的话,任何关于如何做到这一点的建议都将非常受欢迎。

此外,由于我正在研究的数据有两组,患者与对照组(正如你所猜测的,我对组间差异感兴趣),我是否必须研究数据是在两组内正常分布,还是在两组之间总体分布
谢谢

参见@Roman Luštriks上面的评论:预测因子的分布方式无关紧要。(除了多重共线性的问题。)重要的是残差是正态的(并且具有齐次方差)。

最新更新