想象一下,桌子上有4张卡片,其中有几行(例如,演示中有5行(。演示数据框中已经列出了每张卡的价值。然而,卡片的确切位置由pos列索引,请参阅我在下面生成的演示数据。
为了实现这一点,我使用[]
功能在各行之间交换卡,以将卡的值切换回其原始位置。下面的代码已经实现了这样一个目的。为了避免明确使用循环,我想知道如果我对tidyverse系列的包使用矢量化函数,例如pmap或包purrr中的相关函数,是否可以实现类似的效果?
# 1. data generation ------------------------------------------------------
rm(list=ls())
vect<-matrix(round(runif(20),2),nrow=5)
colnames(vect)<-paste0('card',1:4)
order<-rbind(c(2,3,4,1),c(3,4,1,2),c(1,2,3,4),c(4,3,2,1),c(3,4,2,1))
colnames(order)=paste0('pos',1:4)
dat<-data.frame(vect,order,stringsAsFactors = F)
# 2. data swap ------------------------------------------------------------
for (i in 1:dim(dat)[1]){
orders=dat[i,paste0('pos',1:4)]
card=dat[i,paste0('card',1:4)]
vec<-card[order(unlist(orders))]
names(vec)=paste0('deck',1:4)
dat[i,paste0('deck',1:4)]<-vec
}
dat
您可以使用pmap_dfr
:
card_cols <- grep('card', names(dat))
pos_cols <- grep('pos', names(dat))
dat[paste0('deck', seq_along(card_cols))] <- purrr::pmap_dfr(dat, ~{
x <- c(...)
as.data.frame(t(unname(x[card_cols][order(x[pos_cols])])))
})
dat
# card1 card2 card3 card4 pos1 pos2 pos3 pos4 deck1 deck2 deck3 deck4
#1 0.05 0.07 0.16 0.86 2 3 4 1 0.86 0.05 0.07 0.16
#2 0.20 0.98 0.79 0.72 3 4 1 2 0.79 0.72 0.20 0.98
#3 0.50 0.79 0.72 0.10 1 2 3 4 0.50 0.79 0.72 0.10
#4 0.03 0.98 0.48 0.06 4 3 2 1 0.06 0.48 0.98 0.03
#5 0.41 0.72 0.91 0.84 3 4 2 1 0.84 0.91 0.41 0.72
这里需要注意的一点是确保pmap
函数的输出没有列的原始名称。如果它们有原始名称,它会根据名称重新排列列,并且输出的顺序不正确。我在这里使用unname
来删除这些名称。