r-在给定点之后将列的值设置为NA

我有一个这样的数据集：

ID   NUMBER   X
1      5      2
1      3      4
1      6      3
1      2      5
2      7      3
2      3      5
2      9      3
2      4      2

我想在变量NUMBER为每个ID增加(即使再次减少(后，将变量X的值设置为NA，并获得：

ID   NUMBER   X
1     5       2
1     3       4
1     6       NA
1     2       NA
2     7       3
2     3       5
2     9       NA
2     4       NA

我该怎么做？谢谢你的帮助！

当然不是最优雅的解决方案，但它非常直观：

library(data.table)
setDT(d)
d[, n := ifelse(NUMBER > shift(NUMBER, 1, "lag"),1,0), by=ID]
d[is.na(n), n := 0]
d[, n := cumsum(n), by=ID]
d[n>0, X := NA ]
d
ID NUMBER  X n
1:  1      5  2 0
2:  1      3  4 0
3:  1      6 NA 1
4:  1      2 NA 1
5:  2      7  3 0
6:  2      3  5 0
7:  2      9 NA 1
8:  2      4 NA 1

您可以使用dplyr包来完成此操作。如果您的数据帧被称为df，那么您可以使用以下代码：

df %>% group_by(ID) %>% 
mutate ( X = c(X[1:(min(which(diff(Number) > 0)))],rep("NA",length(X)-(min(which(diff(Number) > 0)))))) %>% 
as.data.frame()

我首先用ID将它们分组，然后用diff和which找到第一个递增的数字。

相关内容

最新更新

热门标签：