r-如何使用**purrr**pacakge中的"map"系列命令在数据帧中跨行交换列



想象一下,桌子上有4张卡片,其中有几行(例如,演示中有5行(。演示数据框中已经列出了每张卡的价值。然而,卡片的确切位置由pos列索引,请参阅我在下面生成的演示数据。

为了实现这一点,我使用[]功能在各行之间交换卡,以将卡的值切换回其原始位置。下面的代码已经实现了这样一个目的。为了避免明确使用循环,我想知道如果我对tidyverse系列的包使用矢量化函数,例如pmap或包purrr中的相关函数,是否可以实现类似的效果?

# 1. data generation ------------------------------------------------------
rm(list=ls())
vect<-matrix(round(runif(20),2),nrow=5)
colnames(vect)<-paste0('card',1:4)
order<-rbind(c(2,3,4,1),c(3,4,1,2),c(1,2,3,4),c(4,3,2,1),c(3,4,2,1))
colnames(order)=paste0('pos',1:4)
dat<-data.frame(vect,order,stringsAsFactors = F)
# 2. data swap ------------------------------------------------------------
for (i in 1:dim(dat)[1]){
orders=dat[i,paste0('pos',1:4)]
card=dat[i,paste0('card',1:4)]
vec<-card[order(unlist(orders))]
names(vec)=paste0('deck',1:4)
dat[i,paste0('deck',1:4)]<-vec
}
dat

您可以使用pmap_dfr:

card_cols <- grep('card', names(dat))
pos_cols <- grep('pos', names(dat))
dat[paste0('deck', seq_along(card_cols))] <- purrr::pmap_dfr(dat, ~{
x <- c(...)
as.data.frame(t(unname(x[card_cols][order(x[pos_cols])])))
})
dat
#  card1 card2 card3 card4 pos1 pos2 pos3 pos4 deck1 deck2 deck3 deck4
#1  0.05  0.07  0.16  0.86    2    3    4    1  0.86  0.05  0.07  0.16
#2  0.20  0.98  0.79  0.72    3    4    1    2  0.79  0.72  0.20  0.98
#3  0.50  0.79  0.72  0.10    1    2    3    4  0.50  0.79  0.72  0.10
#4  0.03  0.98  0.48  0.06    4    3    2    1  0.06  0.48  0.98  0.03
#5  0.41  0.72  0.91  0.84    3    4    2    1  0.84  0.91  0.41  0.72

这里需要注意的一点是确保pmap函数的输出没有列的原始名称。如果它们有原始名称,它会根据名称重新排列列,并且输出的顺序不正确。我在这里使用unname来删除这些名称。

最新更新