获取 R 数据表中行中最后一个非 NA 值的位置



假设我有以下data.table,有四个学生和他们对四个问题的回答:

library(data.table)
dt <- data.table(
student = 1:4,
q1 = c(1, 1, 1, NA),
q2 = c(2, 2, NA, NA),
q3 = c(3, NA, 3, NA),
q4 = c(4, NA, NA, NA)
)
# dt
#    student q1 q2 q3 q4
# 1:       1  1  2  3  4
# 2:       2  1  2 NA NA
# 3:       3  1 NA  3 NA
# 4:       4 NA NA NA NA

从每行右侧获取第一个非 NA 值(但在问题列q1q4内(以获取下面的last_q_answered列的优雅 r data.table 方法是什么?

#    student q1 q2 q3 q4 last_q_answered
# 1:       1  1  2  3  4               4
# 2:       2  1  2 NA NA               2
# 3:       3  1 NA  3 NA               3
# 4:       4 NA NA NA NA               0

我们可以使用max.col

max.col(!is.na(dt[, -1]), ties.method = 'last') * +(rowSums(!is.na(dt[,-1])) > 0)
#[1] 4 2 3 0

我们可以将melt与"学生"on连接一起使用

library(data.table)
dt[melt(dt, id.var = 'student', na.rm = TRUE)[, 
value[.N], .(student)], last_q_answered := V1, on = .(student)][]

最新更新