R中关于矢量化的一个错误



我的R代码如下。主要任务是计算重复的行数。

library(plyr)
data<-data.frame(1,2,3);
x <- read.table(text = "ID1    ID2    n    m
13    156   12   15
94    187   14   16
66    297   41   48
29    89    42   49
78    79    51   79", header= TRUE)
distfunc <- function(data,ID1,ID2,n,m){
X1<-ID1; ################
X2<-ID2; ################
X3<-unlist(mapply(':', n, m));
data<-rbind(data,data.frame(X1,X2,X3));
return(data);
}
data<-distfunc(data,x$ID1, x$ID2,x$n, x$m)
data<-data[-1,]
    plyr::count(data, names(data)); ## Calculates the row number of repetitions

我得到的错误信息:

Error in data.frame(X1, X2, X3) : 
  arguments imply differing number of rows: 5, 52

我试图通过R错误来修复它:"在数值表达式中有19个元素:只使用了第一个",但它失败了,结果是错误的。这个问题和那个问题不一样。

我想你想做的是:

# library(plyr)
# data<-data.frame(1,2,3);
x <- read.table(header=TRUE, text = 
"ID1    ID2    n    m
  13    156   12   15
  94    187   14   16
  66    297   41   48
  29    89    42   49
  78    79    51   79")
#distfunc <- function(data, ID1, ID2, n, m) {
#  X1 <- ID1 ################
#  X2 <- ID2 ################
#  X3 <- unlist(mapply(':', n, m))
#  data <- rbind(data, data.frame(X1,X2,X3))
#}
#data <- distfunc(data, x$ID1, x$ID2, x$n, x$m)
L <- apply(x, 1, function(x) data.frame(X1=x[1], X2=x[2], X3=x[3]:x[4], row.names=NULL))
data <- L[[1]]
for (i in 2:length(L)) data <- rbind(data, L[[i]])

或者在apply():中具有更好的可读功能

L <- apply(x, 1, function(r) data.frame(X1=r["ID1"], X2=r["ID2"], X3=r["n"]:r["m"], row.names=NULL))
data <- L[[1]]; for (i in 2:length(L)) data <- rbind(data, L[[i]])

这里有一个更简单的变体:

data <- data.frame(X1=x$ID1[1], X2=x$ID2[1], X3=x$n[1]:x$m[1])
for (i in 2:nrow(x)) data <- rbind(data, data.frame(X1=x$ID1[i], X2=x$ID2[i], X3=x$n[i]:x$m[i]))

我刚刚修复了它。

distfunc <- function(data, ID1, ID2, n, m) {
  X1 <- ID1
  X2 <- ID2
  X3 <- unlist(mapply(':', n, m))
  data <- rbind(data,data.frame(X1, X2, X3))
  return(data)
}

相关内容

最新更新