在用于推理统计的线性模型中,是否应该将不平衡变量用作自变量



Hej,

情况:我正在尝试创建一个线性(混合)模型。我从以前的研究中知道,一个人的性别和疾病严重程度会影响结果变量。我感兴趣的变量叫做治疗。我计划使用似然比测试来测试治疗效果。

问题:我现在分析的研究不平衡:

  • 33%的参与者是女性,67%是男性
  • 女性的疾病严重程度高于男性
  • 33%的女性和50%的男性接受了药物治疗

问题

  • 在用于推理统计的线性(混合)模型中,性别是否应该被视为自变量
  • 如果由于共线性而避免包括这两个变量并且可以性;覆盖两者";,疾病和性别特异性(混杂)影响

我对性别和疾病严重程度对结果的影响不直接感兴趣,因为我的重点是治疗对结果的效果,我主要感兴趣的是创建一个既有医学意义又有统计学意义的模型。

非常感谢:)

在用于推理统计的线性(混合)模型中,性别是否应该被视为自变量?

如果由于共线而避免包括这两个变量;覆盖两者";,疾病和性别特异性(混杂)影响?

通常将性别作为回归因子纳入回归模型,因为它是一个潜在的混杂因素。性通常与结果和主要暴露有因果关系,所以是的,如果你的研究中可能存在这种情况,那么就应该将其包括在内。设计不平衡并不重要——混合模型能够处理这种情况。只有当相关性极高时,多重共线才会成为问题。我们预计会有一定的相关性。

我建议绘制一个DAG来确定要包含/排除哪些变量。有关如何以及为什么要这样做的详细信息,请参阅本线程:
DAG如何帮助减少因果推断中的偏见?

最新更新