假设我有以下data.table,有四个学生和他们对四个问题的回答:
library(data.table)
dt <- data.table(
student = 1:4,
q1 = c(1, 1, 1, NA),
q2 = c(2, 2, NA, NA),
q3 = c(3, NA, 3, NA),
q4 = c(4, NA, NA, NA)
)
# dt
# student q1 q2 q3 q4
# 1: 1 1 2 3 4
# 2: 2 1 2 NA NA
# 3: 3 1 NA 3 NA
# 4: 4 NA NA NA NA
从每行右侧获取第一个非 NA 值(但在问题列q1
到q4
内(以获取下面的last_q_answered
列的优雅 r data.table 方法是什么?
# student q1 q2 q3 q4 last_q_answered
# 1: 1 1 2 3 4 4
# 2: 2 1 2 NA NA 2
# 3: 3 1 NA 3 NA 3
# 4: 4 NA NA NA NA 0
我们可以使用max.col
:
max.col(!is.na(dt[, -1]), ties.method = 'last') * +(rowSums(!is.na(dt[,-1])) > 0)
#[1] 4 2 3 0
我们可以将melt
与"学生"on
连接一起使用
library(data.table)
dt[melt(dt, id.var = 'student', na.rm = TRUE)[,
value[.N], .(student)], last_q_answered := V1, on = .(student)][]