>我有这样的表格:
| Group | Id | value |
| :---- | :- | :---- |
| A | a | 0 |
| A | b | 1 |
| A | c | 2 |
| A | d | 0 |
| A | e | 1 |
| B | f | 0 |
| B | g | 1 |
| B | h | 2 |
| B | i | 0 |
| B | j | 1 |
我想添加一个列,其值基于同一组下以前和当前行之间的比较。
该列从值 1 开始,如果前一个值大于当前值,则该列将递增,并且这可能在同一组中发生。
| Group | Id | value | iteration |
| :---- | :- | :---- | :-------- |
| A | a | 0 | 1 |
| A | b | 1 | 1 |
| A | c | 2 | 1 |
| A | d | 0 | 2 |
| A | e | 1 | 2 |
| B | f | 0 | 1 |
| B | g | 1 | 1 |
| B | h | 2 | 1 |
| B | i | 0 | 2 |
| B | j | 1 | 2 |
我试过这个:
df[ , iteration := if (value < shift(value)) shift(iteration) + 1 else shift(iteration), by = Group]
但它返回错误:
if 中的警告消息(值<移位(值((> 1 并且只有第一个 元素将被使用">
if (值
提前致谢
dplyr
解决方案:
library(dplyr)
df <- data.frame(Group=rep(c("A","B"), each=5),
ID=letters[1:10], value=c(0,1,2,0,1,0,1,2,0,1))
df %>% group_by(Group) %>%
mutate(Iteration = cumsum(ifelse(value >= lag(value, default=Inf), 0, 1)))
编辑:以前我写了"default = 1",但这仅在每个组中的值以 0 开头时才有效。我用 Inf 替换了它,这样即使第一个值不是 0 也能工作。 EDIT2:现在,当后续两行中的值相同时,它可以正常工作。
df%>%
group_by(Group)%>%
mutate(new = cumsum(c(1, diff(value)) < 0) + 1)
# A tibble: 10 x 4
# Groups: Group [2]
Group ID value new
<fct> <fct> <dbl> <dbl>
1 A a 0 1
2 A b 1 1
3 A c 2 1
4 A d 0 2
5 A e 1 2
6 B f 0 1
7 B g 1 1
8 B h 2 1
9 B i 0 2
10 B j 1 2