我有一个包含数百种疾病的代码列表,每个疾病都有多个codes
。我需要为每种疾病保存一个单独的代码列表,并以特定的代码列表名称命名。
我使用下面的命令为每种疾病创建了一个大的列表向量:
Disease <- as.character(c("HIV","HIV", "HIV", "HIV", "anaemia", "anaemia", "anaemia", "Chronic Kidney Disease", "Chronic Kidney Disease"))
Code <- c(123, 432, 567, 876, 433, 096, 543, 912, 456)
codelist <- data.frame(Disease, Code)
codelist
Disease Code
1 HIV 123
2 HIV 432
3 HIV 567
4 HIV 876
5 anaemia 433
6 anaemia 96
7 anaemia 543
8 Chronic Kidney Disease 912
9 Chronic Kidney Disease 456
list <- codelist %>%
dplyr::group_split(Disease)
这给了我每种疾病的一个列表:
> list
<list_of<
tbl_df<
Disease: character
Code : double
>
>[3]>
[[1]]
# A tibble: 3 × 2
Disease Code
<chr> <dbl>
1 anaemia 433
2 anaemia 96
3 anaemia 543
[[2]]
# A tibble: 2 × 2
Disease Code
<chr> <dbl>
1 Chronic Kidney Disease 912
2 Chronic Kidney Disease 456
[[3]]
# A tibble: 4 × 2
Disease Code
<chr> <dbl>
1 HIV 123
2 HIV 432
3 HIV 567
4 HIV 876
此外,我有一个df
,其中根据疾病列出了每个代码列表的名称:
Disease <- as.character(c("anaemia", "Chronic Kidney Disease", "HIV"))
File_name <- c("ICD_anemia_2010", "ICD_CKD_2022", "ICD_HIV_2010")
Codelists_names <- data.frame(Disease, File_name)
Codelists_names
Disease File_name
1 anaemia ICD_anemia_2010
2 Chronic Kidney Disease ICD_CKD_2022
3 HIV ICD_HIV_2010
我想为每个疾病导出一个单独的csv
文件,根据与特定疾病匹配的Codelists_names
中的column
File_name
命名每个文件。
请问我该怎么做?非常感谢。
这里基本上有两个步骤:
- 使用
dplyr::left_join()
合并文件名,然后使用File_name
合并base::split()
。这将为您提供一个命名的数据帧列表,其中每个名称都是要保存的文件名 - 使用
purrr::iwalk()
迭代列表,将每个数据帧保存到其名称中指定的路径
library(tidyverse)
codelist %>%
left_join(Codelists_names, by = "Disease") %>%
split(.$File_name) %>%
map(~ select(.x, !File_name)) %>%
iwalk(~ write_csv(.x, str_c(.y, ".csv")))
# check results
list.files(pattern = "csv")
# "ICD_anemia_2010.csv" "ICD_CKD_2022.csv" "ICD_HIV_2010.csv"
read_csv("ICD_HIV_2010.csv")
# # A tibble: 4 x 2
# Disease Code
# <chr> <dbl>
# 1 HIV 123
# 2 HIV 432
# 3 HIV 567
# 4 HIV 876