我正在尝试创建一个具有逻辑链接的二项式GLM来建模我的数据。的变量分别是:年龄(年龄组;25-29岁、30-39岁或40-49岁)、学历(学历;高或低),想要更多(可能长期想要更多的孩子;是或否),using(使用避孕措施的妇女人数)和notUsing(未使用避孕措施的妇女人数)。
我试图用教育、年龄和愿望等变量来预测不使用避孕措施的妇女人数。
我已经设置了我的模型如下所示,但由于错误信息,我无法让它工作,如下所示。有人知道我在建立模型时哪里出错了吗?
我的模型my_model = glm(cbind(notUsing, using-notUsing) ~ age + education + wantsMore,
data = contraceptive2,
family = binomial(link = "logit"))
错误消息
Error in family$linkfun(mustart) : Value 7.64286 out of range (0, 1)
假设这是链接到我的解释变量,但不确定如何改变它
我dataframe
head(contraceptive2)
age education wantsMore notUsing using
1 <25 low yes 53 6
2 <25 low no 10 4
3 <25 high yes 200 52
4 <25 high no 50 10
5 25-29 low yes 60 14
6 25-29 low no 19 10
公式左侧的两列矩阵应该包含" successes"one_answers"失败",即在本例中"未使用"。和";using"(或者相反)。你不想从失败中减去成功。除此之外,该数据的失败次数为负数!试一试:
my_model = glm(cbind(notUsing, using) ~ age + education + wantsMore,
data = contraceptive2,
family = binomial(link = "logit"))