r/dplyr:在UDF中使用动态命名变量



我对使用dplyr编写用户定义函数有点陌生,我想在我的函数中使用动态定义的变量。我已经通过这里、这里和这里的文档取得了部分进展,但我担心我可能没有正确的命名法来找到我要做的事情。

我想定义一个函数,它在mutate调用中创建一个变量,然后在其他调用中使用该变量。例如,

library(tidyverse)
library(PropCIs)
for_share_plot <- function(data, dummy, group_var){
    dummy_sum <- paste0(quo_name(enquo(dummy)), "_sum")
    data %>% 
       mutate("{{dummy}}_sum" := sum({{dummy}})) %>% 
       mutate("{{dummy}}_prop" := (!!dummy_sum)/{{group_var}},
              "{{dummy}}_lowerci" := scoreci(!!dummy_sum, {{group_var}}, conf.level = 0.95)$conf.int[1],
              "{{dummy}}_upperci" := scoreci(!!dummy_sum, {{group_var}}, conf.level = 0.95)$conf.int[2])
}
df <- mtcars %>%
    add_count(cyl, name = 'group_n') %>%
    group_by(cyl) %>%
    for_share_plot(data = ., dummy = am, group_var = group_n)

返回以下错误消息

#Error: Problem with `mutate()` input `am_prop`.
#x non-numeric argument to binary operator
#ℹ Input `am_prop` is `"am_sum"/group_n`.
#ℹ The error occured in group 1: cyl = 4.

我知道它将{{dummy}}_prop的第一个输入解释为字符串,但我不知道如何从上面引用先前定义的列。如有任何指导,将不胜感激。

您正确地识别出dummy_sum是一个字符串,因此您可以将其转换为!!可以通过使用sym()命令计算的符号。

尝试对您的代码进行以下修改:

for_share_plot <- function(data, dummy, group_var){
    dummy_sum <- sym(paste0(quo_name(enquo(dummy)), "_sum"))
    data %>% 
       mutate("{{dummy}}_sum" := sum({{dummy}})) %>% 
       mutate("{{dummy}}_prop" := (!!dummy_sum)/{{group_var}},
              "{{dummy}}_lowerci" := scoreci(!!dummy_sum, {{group_var}}, conf.level = 0.95)$conf.int[1],
              "{{dummy}}_upperci" := scoreci(!!dummy_sum, {{group_var}}, conf.level = 0.95)$conf.int[2])
}

可以使用.data代词指代列名。

library(dplyr)
library(PropCIs)
for_share_plot <- function(data, dummy, group_var){
  
  dummy_sum <- paste0(quo_name(enquo(dummy)), "_sum")
  
  data %>% 
    mutate("{{dummy}}_sum" := sum({{dummy}}),
           "{{dummy}}_prop" := .data[[dummy_sum]]/{{group_var}},
           "{{dummy}}_lowerci" := scoreci(.data[[dummy_sum]], {{group_var}}, conf.level = 0.95)$conf.int[1],
           "{{dummy}}_upperci" := scoreci(.data[[dummy_sum]], {{group_var}}, conf.level = 0.95)$conf.int[2])
}
mtcars %>%
  add_count(cyl, name = 'group_n') %>%
  group_by(cyl) %>%
  for_share_plot(dummy = am, group_var = group_n)

最新更新