>我需要一些数据分析方面的帮助。
我确实有两个数据集(之前和之后),我想看看它们之间的差异有多大。
以前
11330 STAT1
2721 STAT2
52438 STAT3
6124 SUZY
后
17401 STAT1
3462 STAT2
0 STAT3
72 SUZY
试图将它们与tapply(before$V1, before$V2, FUN=mean)
分组.
但是当我试图绘制它时,在 x 轴上没有获得组名称而是获得数字。如何绘制此类应用数据(Y 轴上的频率和 X 轴上的组名)?
还想问R中比较此类数据集的正确命令是什么,因为我愿意找到它们之间的差异?
编辑
看跌期权(之前$V1)
c(11330L, 2721L, 52438L, 6124L)dput(之前$V2)
结构(1:4, .标签 = c("STAT1", "STAT2", "STAT3","SUZY"),class = "factor")
这里有几个想法。
这就是我认为您的数据的样子?
before <- data.frame(val=c(11330,2721,52438,6124),
lab=c("STAT1","STAT2","STAT3","SUZY"))
after <- data.frame(val=c(17401,3462,0,72),
lab=c("STAT1","STAT2","STAT3","SUZY"))
将它们合并到具有period
变量的单个数据框中:
combined <- rbind(data.frame(before,period="before"),
data.frame(after,period="after"))
重新格式化为矩阵并绘制(基数 R) dotchart
:
library(reshape2)
m <- acast(combined,lab~period,value.var="val")
dotchart(m)
与ggplot
的情节:
library(ggplot2)
qplot(lab,val,colour=period,data=combined)