r-如何为列表的每个元素导出csv文件,并根据另一个数据集的匹配值命名文件



我有一个包含数百种疾病的代码列表,每个疾病都有多个codes。我需要为每种疾病保存一个单独的代码列表,并以特定的代码列表名称命名。

我使用下面的命令为每种疾病创建了一个大的列表向量:

Disease <- as.character(c("HIV","HIV", "HIV", "HIV", "anaemia", "anaemia", "anaemia", "Chronic Kidney Disease", "Chronic Kidney Disease"))
Code <- c(123, 432, 567, 876, 433, 096, 543, 912, 456)
codelist <- data.frame(Disease, Code)
codelist
Disease Code
1                    HIV  123
2                    HIV  432
3                    HIV  567
4                    HIV  876
5                anaemia  433
6                anaemia   96
7                anaemia  543
8 Chronic Kidney Disease  912
9 Chronic Kidney Disease  456
list <- codelist %>%
dplyr::group_split(Disease)

这给了我每种疾病的一个列表:

> list
<list_of<
tbl_df<
Disease: character
Code   : double
>
>[3]>
[[1]]
# A tibble: 3 × 2
Disease  Code
<chr>   <dbl>
1 anaemia   433
2 anaemia    96
3 anaemia   543
[[2]]
# A tibble: 2 × 2
Disease                 Code
<chr>                  <dbl>
1 Chronic Kidney Disease   912
2 Chronic Kidney Disease   456
[[3]]
# A tibble: 4 × 2
Disease  Code
<chr>   <dbl>
1 HIV       123
2 HIV       432
3 HIV       567
4 HIV       876

此外,我有一个df,其中根据疾病列出了每个代码列表的名称:

Disease <- as.character(c("anaemia", "Chronic Kidney Disease", "HIV"))
File_name <- c("ICD_anemia_2010", "ICD_CKD_2022", "ICD_HIV_2010")
Codelists_names <- data.frame(Disease, File_name)
Codelists_names
Disease       File_name
1                anaemia ICD_anemia_2010
2 Chronic Kidney Disease    ICD_CKD_2022
3                    HIV    ICD_HIV_2010

我想为每个疾病导出一个单独的csv文件,根据与特定疾病匹配的Codelists_names中的columnFile_name命名每个文件。

请问我该怎么做?非常感谢。

这里基本上有两个步骤:

  1. 使用dplyr::left_join()合并文件名,然后使用File_name合并base::split()。这将为您提供一个命名的数据帧列表,其中每个名称都是要保存的文件名
  2. 使用purrr::iwalk()迭代列表,将每个数据帧保存到其名称中指定的路径
library(tidyverse)
codelist %>% 
left_join(Codelists_names, by = "Disease") %>% 
split(.$File_name) %>% 
map(~ select(.x, !File_name)) %>% 
iwalk(~ write_csv(.x, str_c(.y, ".csv")))
# check results
list.files(pattern = "csv")
# "ICD_anemia_2010.csv" "ICD_CKD_2022.csv"    "ICD_HIV_2010.csv"
read_csv("ICD_HIV_2010.csv")
# # A tibble: 4 x 2
#   Disease  Code
#   <chr>   <dbl>
# 1 HIV       123
# 2 HIV       432
# 3 HIV       567
# 4 HIV       876

相关内容

最新更新