使用R进行的二项式分布



有两个列,ID和概率

        ID probability
        1  0.5
        2  0.8
        3  0.3

我想模拟每个ID的疾病状态,以健康为0,生病1。每个ID生病的概率在第二列中。

我尝试了

df$sick <- rbinom(1,1,df$probability)

但是我得到了所有零或一个。我究竟做错了什么?预先感谢您的帮助!

您的问题是,您仅将n设置为1,因此rbinom仅返回一个值,该值可重用所有行(通过R的标准重用规则(。参见?rbinom。这样的事情应该可以解决:

df <- read.table(header = TRUE, text = "ID probability
    1  0.5
    2  0.8
    3  0.3")
df$sick <- rbinom(n = nrow(df), size = 1, prob = df$probability)
print(df)
#  ID probability sick
#1  1         0.5    1
#2  2         0.8    1
#3  3         0.3    0

最新更新