因此,我希望将权重应用于数据帧中的观测值,而且我已经有了一整列要应用于数据的权重。
这就是我的数据帧的样子。
权重 | 计数 | |
---|---|---|
3 | 67 | |
7 | 355 | |
8 | 25 | |
7 | 2 |
我仍然不确定如何以您想要的方式将权重应用于计数数据。我只想展示一下,您可以使用dplyr
以一种方便的方式在前一列的基础上创建一个新列。例如:
mydf
# weight count
# 1 3 67
# 2 7 355
# 3 8 25
# 4 7 2
mydf %>% mutate(weightedCount = weight*count,
percentRank = percent_rank(weightedCount),
cumDist = cume_dist(weightedCount))
# weight count weightedCount percentRank cumDist
# 1 3 67 201 0.6666667 0.75
# 2 7 355 2485 1.0000000 1.00
# 3 8 25 200 0.3333333 0.50
# 4 7 2 14 0.0000000 0.25
这里,weightedCount
是weight
和count
的乘积,percentRank
表示weightedCount
中每个数据的秩,cumDist
表示weightedCount
中数据的累积分布。
这就是一个例子。您可以以类似的方式创建另一列并应用其他函数。