有两个列,ID和概率
ID probability
1 0.5
2 0.8
3 0.3
我想模拟每个ID的疾病状态,以健康为0,生病1。每个ID生病的概率在第二列中。
我尝试了
df$sick <- rbinom(1,1,df$probability)
但是我得到了所有零或一个。我究竟做错了什么?预先感谢您的帮助!
您的问题是,您仅将n
设置为1,因此rbinom
仅返回一个值,该值可重用所有行(通过R的标准重用规则(。参见?rbinom
。这样的事情应该可以解决:
df <- read.table(header = TRUE, text = "ID probability
1 0.5
2 0.8
3 0.3")
df$sick <- rbinom(n = nrow(df), size = 1, prob = df$probability)
print(df)
# ID probability sick
#1 1 0.5 1
#2 2 0.8 1
#3 3 0.3 0