>我需要将表格排列成以下格式,以使其他人清楚地看到哪个名称是重复的以及相应的值
#original df
df <- data.frame(name=c('a','a','a','b','b'),
value=(c(1,2,3,4,5)),stringsAsFactors = FALSE)
#df
name value
a 1
a 2
a 3
b 4
b 5
#target df
name1 value1 name2 value2 name3 value3
a 1 a 2 a 3
b 4 b 5 NA NA
希望解决方案可以自动扩展列。如果"a"重复 4 次,则目标 df 应为 8 列(4 对"名称"和"值"(
谢谢
这是一个data.table
的解决方案。您可以使用rleid
在每个name
内创建一个索引(id
(,然后使用name
对该id
进行数据透视
library(data.table)
setDT(df)
df[, id := rleid(value), by=name]
dcast(df, name ~ id, value.var="value")
输出:
name 1 2 3
1: a 1 2 3
2: b 4 5 NA