我想做的是:从一个数据框中获取列,使用 ifelse 语句重新编码它们,然后将它们移动到新的数据框中,同时使用 dplyr 和管道一次性完成。
问题:代码适用于只有一列的代码,但是一旦 R 在同一行代码中遇到多列,我就会遇到问题。无法识别第二列,R 引发错误。我收到以下错误:
mutate_impl(.data, dots( 中的错误: 评估错误:找不到对象"var2_orig"。
关于为什么会这样的任何想法?也可能有一种更简单的方法,无需使用 ifelse 语句。我也愿意接受这方面的建议,但我仍然很好奇如何使用ifelse执行此操作以及为什么会出现多列的错误。非常感谢。
示例代码:
library(tidyverse)
# creating fake data set
df_orig <- data_frame(var1_orig = sample(1:3, 50, replace = T),
var2_orig = sample(-2:2, 50, replace = T))
# works for one var (recoding 3's as NA, 2's as 1, and 1's as 0):
df_new <- df_orig %>%
as_tibble() %>%
transmute(var1_new = ifelse(var1_orig == 3, NA, ifelse(var1_orig ==
2, 1, ifelse(var1_orig == 1, 0, var1_orig))))
# and works the other var (recoding negatives as NA, 1's and 2's as 1, and
leaving 0's as 0's):
df_new <- df_orig %>%
as_tibble() %>%
transmute(var2_new = ifelse(var2_orig < 0, NA, ifelse(var2_orig ==
1 | var2_orig == 2, 1, 0)))
# but not together in same line of code (error: var2_orig not recognized):
df_new <- df_orig %>%
as_tibble() %>%
transmute(var1_new = ifelse(var1_orig == 3, NA, ifelse(var1_orig ==
2, 1, ifelse(var1_orig == 1, 0, var1_orig)))) %>%
transmute(var2_new = ifelse(var2_orig < 0, NA, ifelse(var2_orig ==
1 | var2_orig == 2, 1, 0)))
Transmute将删除变量,因此会出现错误。您可以使用mutate
更新现有变量,然后rename_all
(如果需要(更改其名称,
df_orig %>%
as_tibble() %>%
mutate(var1_orig = ifelse(var1_orig == 3, NA, ifelse(var1_orig == 2, 1,
ifelse(var1_orig == 1, 0, var1_orig))),
var2_orig = ifelse(var2_orig < 0, NA, ifelse(var2_orig == 1 | var2_orig == 2, 1, 0))) %>%
rename_all(funs(sub('_.*', '_new', .)))
dplyr 的动词transmute
只保留您创建的变量,并删除原始变量,因此var2_orig
在第二个transmute
中不再存在。
您可以在同一transmute
调用中创建两个变量,使用mutate
,然后删除原始变量(如果不需要(。
顺便说一下,case_when
在这里会很有用:
df_orig %>%
transmute(var1_new = case_when(var1_orig == 3 ~ NA_integer_,
var1_orig == 2 ~ 1L,
TRUE ~ var1_orig),
var2_new = case_when(var2_orig < 0 ~ NA_integer_,
var2_orig %in% 1:2 ~ 1L,
TRUE ~ 0L)
)
#> # A tibble: 50 x 2
#> var1_new var2_new
#> <int> <int>
#> 1 1 1
#> 2 1 1
#> 3 1 0
#> 4 NA NA
#> 5 NA 0
#> 6 1 NA
#> 7 1 1
#> 8 1 1
#> 9 1 1
#> 10 1 1
#> # ... with 40 more rows