从概率分布创建数据集



在R中,我需要创建一个数据集,其中有57个0,203个1,383个2等等。我以为我能够从概率分布创建数据集:

sample_dist <- sample(c(0,1,2,3,4,5,6,7,8,9,10,11,12,13,14), size = 2608, 
replace = FALSE, prob = c(57/2608, 203/2608, 383/2608, 525/2608, 532/2608,
 408/2608, 273/2608, 139/2608, 45/2608, 27/2608, 10/2608, 4/2608, 0/2608, 1/2608, 1/2608))

但这种剂量不起作用。如果我设置replace = TRUE我会从相同的分布中得到一个样本,但有替换,这不会完全产生我想要的数据集。我做错了什么?创建此类数据集的好方法还是您有更优雅的方法?

像这样:

ccc <- c(rep(0, 57), rep(1, 203), rep(2, 383)) #and so on
ccc <- sample(ccc) # shuffle values
cdf <- data.frame(r = ccc) # if you want data frame

最新更新