R 使用 if 语句改变多个列



我有这样的数据:

cols <- c("X01_01","X01_01_p", "X01_02","X01_02_p", "X01_03","X01_03_p", "X01_04", "X01_05","X01_06")
set.seed(111)
values <- replicate(9, sample(1:5, 4, replace = TRUE)) 
df <- as.data.frame(values)  

所以我的df看起来像这样:

X01_01 X01_01_p X01_02 X01_02_p X01_03 X01_03_p X01_04 X01_05 X01_06
1      3        2      3        1      1        3      5      4      3
2      4        3      1        1      5        2      2      3      3
3      2        1      3        1      2        2      4      1      2
4      3        3      3        3      4        2      2      3      4

我有一些列用于突变(不是全部(和新列的名称。

cols_to_mutate <- c("X01_01_p","X01_02_p", "X01_03_p", "X01_04", "X01_05","X01_06")
new_cols <- c("X01_01_n","X01_02_n", "X01_03_n", "X01_04_n", "X01_05_n","X01_06_n")

每个突变都是相同的:

  • 如果值为 1 或 2,则新值必须为 0
  • 如果值为 3,则新值必须为 0.5
  • 如果值为 4 或 5,则新值必须为 1

最终我的 df 看起来像这样:

X01_01 X01_01_p X01_02 X01_02_p X01_03 X01_03_p X01_04 X01_05 X01_06 X01_01_n X01_02_n X01_03_n X01_04_n X01_05_n X01_06_n
1      3        2      3        1      1        3      5      4      3      0.0      0.0      0.5        1      1.0      0.5
2      4        3      1        1      5        2      2      3      3      0.5      0.0      0.0        0      0.5      0.5
3      2        1      3        1      2        2      4      1      2      0.0      0.0      0.0        1      0.0      0.0
4      3        3      3        3      4        2      2      3      4      0.5      0.5      0.0        0      0.5      1.0

在"硬编码"中,我可以写很多这样的行:

df <- mutate(df, X01_01_n = ifelse(X01_01_p <= 2, 0, (ifelse(X01_01_p == 3, 0.5, 1))))
df <- mutate(df, X01_02_n = ifelse(X01_02_p <= 2, 0, (ifelse(X01_02_p == 3, 0.5, 1))))

但是,当然,我正在寻找一种更花哨,更快捷的方法,但是我搜索了又搜索,但没有找到解决方案。我试过了:

df <- cbind(df,apply(df[,cols_to_mutate],2, function(x) if (x < 3) { 0} else if (x > 3) {1} else {.5}))

但这行不通。任何想法都会很棒!!

如果保留前面的列而不是原地变异并不重要,则可以在用于变异的函数中使用mutate_atcase_when

case_when利用between函数从dplyr到设置条件,然后分配一个带有~的值。最后一个参数T ~ NA_real_NA分配给与任何条件不匹配的任何观测值。

library(tidyverse)
cols_to_mutate <- c("X01_01_p","X01_02_p", "X01_03_p", "X01_04", "X01_05","X01_06")
df %>%
mutate_at(cols_to_mutate, function(x) {
case_when(
between(x, 1, 2) ~ 0,
x == 3 ~ 0.5,
between(x, 4, 5) ~ 1,
T ~ NA_real_
)
})
#>   X01_01 X01_01_p X01_02 X01_02_p X01_03 X01_03_p X01_04 X01_05 X01_06
#> 1      3      0.0      3      0.0      1      0.5      1    1.0    0.5
#> 2      4      0.5      1      0.0      5      0.0      0    0.5    0.5
#> 3      2      0.0      3      0.0      2      0.0      1    0.0    0.0
#> 4      3      0.5      3      0.5      4      0.0      0    0.5    1.0

如果有必要保留原始列并为重新缩放的列指定新名称,这里有一些rlang+purrr棘手之处。我所做的是在数据框的列上imap编辑。如果名称在要更改的列列表中,我使用与上面相同的case_when,并输出一个包含两列的tibble:一列是原始列,其名称使用quo_name:=运算符分配,另一个是新值列,名称相同但_n附加。如果它不是要更改的列,则仅返回原始列的tibble。通过使用imap_dfc,所有列被绑定到一个数据框中。

df %>%
imap_dfc(function(x, name) {
if (name %in% cols_to_mutate) {
new_vals <- case_when(
between(x, 1, 2) ~ 0,
x == 3 ~ 0.5,
between(x, 4, 5) ~ 1,
T ~ NA_real_
)
tibble(!!quo_name(name) := x, !!quo_name(paste0(name, "_n")) := new_vals)
} else {
tibble(!!quo_name(name) := x)
}
})
#> # A tibble: 4 x 15
#>   X01_01 X01_01_p X01_01_p_n X01_02 X01_02_p X01_02_p_n X01_03 X01_03_p
#>    <int>    <int>      <dbl>  <int>    <int>      <dbl>  <int>    <int>
#> 1      3        2        0        3        1        0        1        3
#> 2      4        3        0.5      1        1        0        5        2
#> 3      2        1        0        3        1        0        2        2
#> 4      3        3        0.5      3        3        0.5      4        2
#> # ... with 7 more variables: X01_03_p_n <dbl>, X01_04 <int>,
#> #   X01_04_n <dbl>, X01_05 <int>, X01_05_n <dbl>, X01_06 <int>,
#> #   X01_06_n <dbl>

你可以做这样的事情,假设你的数字只取值 1 到 5。

map_marlein <- function(x) {
if (any(!x %in% 1:5)) {
stop("Needs numbers from 1-5")
}
as.integer(cut(x, c(0,2,3, 10))) / 2 - 0.5
}
df[, paste0(names(df), "_n")] <- lapply(df[, names(df)], map_marlein)
df
X01_01 X01_01_p X01_02 X01_02_p X01_03 X01_03_p X01_04 X01_05 X01_06 X01_01_n X01_01_p_n X01_02_n X01_02_p_n X01_03_n X01_03_p_n X01_04_n X01_05_n X01_06_n
1      3        2      3        1      1        3      5      4      3      0.5        0.0      0.5        0.0        0        0.5        1      1.0      0.5
2      4        3      1        1      5        2      2      3      3      1.0        0.5      0.0        0.0        1        0.0        0      0.5      0.5
3      2        1      3        1      2        2      4      1      2      0.0        0.0      0.5        0.0        0        0.0        1      0.0      0.0
4      3        3      3        3      4        2      2      3      4      0.5        0.5      0.5        0.5        1        0.0        0      0.5      1.0

相关内容

  • 没有找到相关文章

最新更新