根据另一列的值给一列赋值

  • 本文关键字:一列 赋值 dplyr
  • 更新时间 :
  • 英文 :


我有一个像这样的数据帧

 NAME       DIST    
 A          0           
 A          1           
 A          100         
 A          2           
 A          1           
 A          4           
 A          500         
 A          1           
 A          1           

我想要做的是找到一种有效的方法来创建新列NEWNAME这样,如果DIST> 100,它包含一个与前面所有行相同的名称

 NAME       DIST     NEWNAME
 A          0           A
 A          1           A
 A          100         A
 A          2           A2
 A          1           A2
 A          4           A2
 A          500         A3
 A          1           A3
 A          1           A3

我已经使用for循环完成了它,但我正在寻找R风格的更有效的解决方案。在代码下面使用for循环

k <- 0
for(l in 1:length(df$NAME)){
       if(df$DIST[l] >= 100){
                k <- k+1;
                df$NEWNAME[(l):length(df$NAME)] <- paste(df$NAME,k,sep="")
        }
    }

Thanks in advance

创建新列的方法如下:

df$NEWNAME=paste0("A", cumsum(0+df$DIST>=100))

我使用你的数据作为df,并假设你的意思是优于或等于 100:

df=data.frame("NAME"=rep("A", 9), "DIST"=c(0,1,100,2,1,4,500,1,1))

编辑

如果您需要在距离>100的第N+1行开始新名称,您可以在下面执行:

df$NEWNAME2 = lag(df$NEWNAME, n=1, default="A0")
####   NAME DIST NEWNAME NEWNAME2
#### 1    A    0      A0       A0
#### 2    A    1      A0       A0
#### 3    A  100      A1       A0
#### 4    A    2      A1       A1
#### 5    A    1      A1       A1

最新更新