r-创建函数以计数列列表中的值



r folks:

我有一个带有许多列的数据框。每组都是一组调查项目。我想计算每个集合中具有一定值的列数。我写了一个函数来执行此操作,但它导致了附加到我的数据框的重复值列表。

df<- structure(list(RespondentID = c(6764279930, 6779986023, 6760279439, 
6759243066), 
                q1 = c(3L, 3L, 4L, 1L), 
                q2 = c(2L, 2L, 4L, 4L), 
                q3 = c(4L, 2L, 4L, 5L), 
                q0010_0004 = c(1L, 2L, 3L, 1L)),
                    .Names = c("RespondentID", "q1", "q2", "q3", "q4"), 
            row.names = c(NA, 4L), class = "data.frame")

group1<-c("q1","q2","q3","q4")
# Objective: Count number of ratings==4 for each row
# Make function that receives list of columns & 
# then returns ONE column in dataframe with total # columns 
# having certain value (in this case, 4)
countcol<-function(colgroup) {
    s<-subset(df, select=c(colgroup)) #select only the columns designated by list
    s$sum<-Reduce("+", apply(X=s,1,FUN=function(x) (sum(x==4, na.rm = TRUE)))) # count instances of value==4
    s2<-subset(s,select=c(sum))  # return ONE column with result for each row 
    return(s2$sum)  }
countcol(group1)

我的功能, countcol在没有错误的情况下运行,但如上所述,结果似乎是每行的转换列表。我想为每行一个数字,以指示值的计数。

我在这里尝试了各种应用功能,但不能占上风。有人有小费吗?

谢谢!

rowSums可以为您提供OP的结果。每个组的ratings==4返回计数。

rowSums(df[2:5]==4)
#1 2 3 4 
#1 0 3 1 

或仅来自OP的功能的一部分可以给出答案。

apply(df[2:5], 1, function(x)(sum(x==4)))
#1 2 3 4 
#1 0 3 1 

最新更新