R furrer:在运行计算之前,对每个未来的进程验证API



我正在R中使用furrr运行并行计算。计算需要访问web API,并且需要进行身份验证。如果我运行一个并行进程,每个进程都需要进行身份验证。在下面,我有6个过程。因此,我需要首先对这六个进程进行身份验证,然后运行计算。我不知道如何使用furrr来做到这一点。因此,我在每次运行中都要进行身份验证,这真的很低效。

下面是一个简单的示例,用于说明。它不起作用,因为我不能共享api.configure函数,但希望您能理解。

感谢

library(tidyverse)
library(furrr)
plan(multiprocess, workers = 6)
testdf =  starwars %>%
select(-films, -vehicles, -starships) %>%
future_pmap_dfr(.f = function(...){
api.configure(username = "username", password = "password")
currentrow = tibble(...)
l = tibble(name = currentrow$name, height = currentrow$height)
return(l)
})

尝试在映射之前打开连接:

library(tidyverse)
library(furrr)
plan(multiprocess, workers = 6)
future_options(globals = T) # this should be the default
api.configure(username = "username", password = "password")
ls(all=TRUE) #Check if new environment variables are available to save connexion
testdf =  starwars %>%
select(-films, -vehicles, -starships) %>%
future_pmap_dfr(.f = function(...){

currentrow = tibble(...)
l = tibble(name = currentrow$name, height = currentrow$height)
return(l)
})

解决此问题的方法是要求API的开发人员在API包中添加变量,以测试连接是否打开。通过这种方式,如果连接未打开,我将在每个future进程上进行一次身份验证,并且一旦完成,对该进程的所有后续API身份验证调用都将被if子句暂停。

相关内容

  • 没有找到相关文章

最新更新