r folks:
我有一个带有许多列的数据框。每组都是一组调查项目。我想计算每个集合中具有一定值的列数。我写了一个函数来执行此操作,但它导致了附加到我的数据框的重复值列表。
df<- structure(list(RespondentID = c(6764279930, 6779986023, 6760279439,
6759243066),
q1 = c(3L, 3L, 4L, 1L),
q2 = c(2L, 2L, 4L, 4L),
q3 = c(4L, 2L, 4L, 5L),
q0010_0004 = c(1L, 2L, 3L, 1L)),
.Names = c("RespondentID", "q1", "q2", "q3", "q4"),
row.names = c(NA, 4L), class = "data.frame")
group1<-c("q1","q2","q3","q4")
# Objective: Count number of ratings==4 for each row
# Make function that receives list of columns &
# then returns ONE column in dataframe with total # columns
# having certain value (in this case, 4)
countcol<-function(colgroup) {
s<-subset(df, select=c(colgroup)) #select only the columns designated by list
s$sum<-Reduce("+", apply(X=s,1,FUN=function(x) (sum(x==4, na.rm = TRUE)))) # count instances of value==4
s2<-subset(s,select=c(sum)) # return ONE column with result for each row
return(s2$sum) }
countcol(group1)
我的功能, countcol
在没有错误的情况下运行,但如上所述,结果似乎是每行的转换列表。我想为每行一个数字,以指示值的计数。
我在这里尝试了各种应用功能,但不能占上风。有人有小费吗?
谢谢!
rowSums
可以为您提供OP的结果。每个组的ratings==4
返回计数。
rowSums(df[2:5]==4)
#1 2 3 4
#1 0 3 1
或仅来自OP的功能的一部分可以给出答案。
apply(df[2:5], 1, function(x)(sum(x==4)))
#1 2 3 4
#1 0 3 1