r语言 - dplyr unnest()不适用于大型逗号分隔的数据



尝试使用dplyr的unnest函数拆分以逗号分隔的大型字符数据集。数据集的形式:

id                                     keywords
835a24fe-c276-9824-0f4d-35fc81319cca  Analytics,Artificial Intelligence,Big Data,Health Care

我想创建一个具有"id"在第一列和每个"关键字"中在具有相同的"id">

的单独列中我使用的代码是:

CB_keyword <- tibble(id=organizations$uuid[organizations$uuid %in% org_uuid ] , 
keyword=organizations$category_list[organizations$uuid %in% org_uuid]) %>% unnest(keyword, names_sep = ",")

%代码中的%选择了"id"one_answers";keyword"来自另一个表的信息…这是正确的。开巢的管道似乎没有任何作用。标题保持不变,只是列名现在是"keyword,keyword"而不是"keyword",但数据与未使用unnest命令时相同。

如果keywords是字符串列,则使用separate_rows代替unnest

library(dplyr)
library(tidyr)
df1 %>%
separate_rows(keywords, sep=",\s*")

最新更新