¿如何在 r 中对数据框应用权重?



因此,我希望将权重应用于数据帧中的观测值,而且我已经有了一整列要应用于数据的权重。

这就是我的数据帧的样子。

权重 计数
3 67
7 355
8 25
7 2

我仍然不确定如何以您想要的方式将权重应用于计数数据。我只想展示一下,您可以使用dplyr以一种方便的方式在前一列的基础上创建一个新列。例如:

mydf
#  weight count
# 1      3    67
# 2      7   355
# 3      8    25
# 4      7     2
mydf %>% mutate(weightedCount = weight*count, 
percentRank = percent_rank(weightedCount), 
cumDist = cume_dist(weightedCount))
#  weight count weightedCount percentRank cumDist
# 1      3    67           201   0.6666667    0.75
# 2      7   355          2485   1.0000000    1.00
# 3      8    25           200   0.3333333    0.50
# 4      7     2            14   0.0000000    0.25

这里,weightedCountweightcount的乘积,percentRank表示weightedCount中每个数据的秩,cumDist表示weightedCount中数据的累积分布。

这就是一个例子。您可以以类似的方式创建另一列并应用其他函数。

最新更新