我在R中有以下数据:
name = c("person1", "person2", "person1", "person2")
iter = c(1,1,2,2)
col1 = c(12, 33, 55, 8)
col2 = c(4, 7, 88,2)
col3 = c(11,1,6, 7)
col4 = c(55, 2 , 4 ,5)
orig_data = data.frame(name, iter, col1, col2, col3, col4)
数据如下:
name iter col1 col2 col3 col4
1 person1 1 12 4 11 55
2 person2 1 33 7 1 2
3 person1 2 55 88 6 4
4 person2 2 8 2 7 5
我试图使最终结果看起来像这样:
name iter col1_iter1 col1_iter2 col2_iter1 col2_iter2 col3_iter1 col3_iter2 col4_iter1 col4_iter2
1 person1 1 12 55 4 88 11 6 55 4
2 person2 2 33 8 7 2 1 7 2 5
我做了一些研究,发现"data.table"库可以解决这个问题。我在R中尝试了以下代码:
library(data.table)
dcast_data = data.frame(setDT(orig_data), iter ~ name, value.var = c('col1', 'col2', 'col3', 'col4'))
但是这会产生以下错误:
Error in as.data.frame.default(x[[i]], optional = TRUE) :
cannot coerce class ‘"formula"’ to a data.frame
谁能告诉我我做错了什么?既然您想获得宽格式的数据,我认为您正在寻找dcast
函数而不是data.frame
。此外,使用的公式也应更改。
library(data.table)
dcast(setDT(orig_data), name~iter, value.var = c('col1', 'col2', 'col3', 'col4'))
# name col1_1 col1_2 col2_1 col2_2 col3_1 col3_2 col4_1 col4_2
#1: person1 12 55 4 88 11 6 55 4
#2: person2 33 8 7 2 1 7 2 5