我在R中有一个csv,它有下表:
df1
开始 | 效率 | 结束||||
---|---|---|---|---|---|
9955 | 0 | 9955 | 25 | 5848 | |
474909 | 0 | 474909 | 35 | 3948 | |
90342 | 25 | >84384 | |||
94209 | 55 | 99393 |
R不喜欢具有相同名称的列,因此重复的列名变为Start.1
和Efficiency.1
。您可以将0值替换为NA
并使用coalesce
。
library(dplyr)
df1 %>%
mutate(across(contains('Efficiency'), na_if, 0)) %>%
transmute(Start, Efficiency = coalesce(Efficiency, Efficiency.1))
# Start Efficiency
#1 9955 25
#2 474909 35
#3 90342 25
#4 94209 55