r语言 - 比较多个数据框



>我需要一些数据分析方面的帮助。
我确实有两个数据集(之前和之后),我想看看它们之间的差异有多大。

以前

11330    STAT1
2721    STAT2
52438    STAT3
6124    SUZY

17401    STAT1
3462    STAT2
0    STAT3
72    SUZY

试图将它们与tapply(before$V1, before$V2, FUN=mean)分组.
但是当我试图绘制它时,在 x 轴上没有获得组名称而是获得数字。如何绘制此类应用数据(Y 轴上的频率和 X 轴上的组名)?

还想问R中比较此类数据集的正确命令是什么,因为我愿意找到它们之间的差异?


编辑

看跌期权(之前$V1)
c(11330L, 2721L, 52438L, 6124L)

dput(之前$V2)
结构(1:4, .标签 = c("STAT1", "STAT2", "STAT3","SUZY"),class = "factor")

这里有几个想法。

这就是我认为您的数据的样子

before <- data.frame(val=c(11330,2721,52438,6124),
                     lab=c("STAT1","STAT2","STAT3","SUZY"))
after <- data.frame(val=c(17401,3462,0,72),
                     lab=c("STAT1","STAT2","STAT3","SUZY"))

将它们合并到具有period变量的单个数据框中:

combined <- rbind(data.frame(before,period="before"),
      data.frame(after,period="after"))

重新格式化为矩阵并绘制(基数 R) dotchart

library(reshape2)
m <- acast(combined,lab~period,value.var="val")
dotchart(m)

ggplot的情节:

library(ggplot2)
qplot(lab,val,colour=period,data=combined)

相关内容

  • 没有找到相关文章

最新更新