尝试使用dplyr的unnest函数拆分以逗号分隔的大型字符数据集。数据集的形式:
id keywords
835a24fe-c276-9824-0f4d-35fc81319cca Analytics,Artificial Intelligence,Big Data,Health Care
我想创建一个具有"id"在第一列和每个"关键字"中在具有相同的"id">
的单独列中我使用的代码是:
CB_keyword <- tibble(id=organizations$uuid[organizations$uuid %in% org_uuid ] ,
keyword=organizations$category_list[organizations$uuid %in% org_uuid]) %>% unnest(keyword, names_sep = ",")
%代码中的%选择了"id"one_answers";keyword"来自另一个表的信息…这是正确的。开巢的管道似乎没有任何作用。标题保持不变,只是列名现在是"keyword,keyword"而不是"keyword",但数据与未使用unnest命令时相同。
如果keywords
是字符串列,则使用separate_rows
代替unnest
library(dplyr)
library(tidyr)
df1 %>%
separate_rows(keywords, sep=",\s*")