r语言 - DDPLY 函数总和中的错误



>第一次在这里发帖!我在使用 ddply 函数时遇到问题。我有这个表格,我想使用"LC"列进行总结,并在"面积"列中添加值:

  ID LC  per     Area
1  1  7 0.29  62428.3
2  1  7 0.79 170063.3
3  1  4 0.40  86108.0
4  1  7 0.43  92566.1
5  1  6 1.00 215270.0
6  1  7 0.61 131314.7

基于这个数据帧,我期望的正是这样:

LC   Area
4  86108.0
6 215270.0
7 456372.4

应用 ddply 函数,我得到以下结果:

> ddply(x, 'LC', sum)
  LC       V1
1  4  86113.4
2  6 215278.0
3  7 456406.5

格式是完美的,但值中存在一些差异。例如,类 7 的值应为 456372.4,而 ddply 报告的值应为 456406.5。相差34.1。所有值都计算错误。

有人可以解释我为什么会遇到这个问题吗?我在这里错过了什么吗?我的代码有误吗?

谢谢!

您的方法存在两个问题:

  • 你需要告诉ddply什么求和Area)。如果未指定列,ddply对所有列(IDperArea)的值求和。
  • 您可以使用 summarise 参数聚合数据。

此代码有效:

x <- read.table(text="  ID LC  per     Area
1  1  7 0.29  62428.3
2  1  7 0.79 170063.3
3  1  4 0.40  86108.0
4  1  7 0.43  92566.1
5  1  6 1.00 215270.0
6  1  7 0.61 131314.7", header = TRUE)

library(plyr)
ddply(x, .(LC), summarise, sum(Area))

结果:

  LC      ..1
1  4  86108.0
2  6 215270.0
3  7 456372.4

最新更新