将数据帧列表中的列替换为另一个数据帧列表中的列. R.



我有两组格式如下的列表:

list(list(structure(list(X = c(3L, 4L, 5L, 7L, 2L, 8L, 9L, 6L, 
10L, 1L), Y = structure(c(2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 
1L), .Label = c("no", "yes"), class = "factor")), .Names = c("X", 
"Y"), row.names = c(NA, -10L), class = "data.frame"), structure(list(
X = c(3L, 4L, 5L, 7L, 2L, 8L, 9L, 6L, 10L, 1L), Y = structure(c(2L, 
2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L), .Label = c("no", "yes"
), class = "factor")), .Names = c("X", "Y"), row.names = c(NA, 
-10L), class = "data.frame")))

list(list(structure(list(X = c(10L, 3L, 4L, 9L, 8L, 2L, 5L, 7L, 
1L, 6L), Y = structure(c(2L, 1L, 2L, 2L, 2L, 1L, 1L, 2L, 1L, 
1L), .Label = c("no", "yes"), class = "factor")), .Names = c("X", 
"Y"), row.names = c(NA, -10L), class = "data.frame"), structure(list(
X = c(5L, 7L, 4L, 3L, 10L, 2L, 9L, 1L, 8L, 6L), Y = structure(c(2L, 
2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L), .Label = c("no", "yes"
), class = "factor")), .Names = c("X", "Y"), row.names = c(NA, 
-10L), class = "data.frame")))

My objective is to replace a[[1]][[i]]$x <- b[[1]][[i]]$x

当两个数据帧位于列表之外时,这相当简单:

df1$x<-df2$x

但是使用我编写的代码它不起作用

replacex<-function(onelist, anotherlist){
newlist<-list() #for storage
onelist$x<-anotherlist$x
newlist<-onelist 
}

Dfs_new_X<-lapply(a,lapply,replacex,anotherlist=b)

它不会给出错误,而是删除该列。

任何帮助将不胜感激。

我们可以使用purrr包中的map2来进行此替换。dat是最终输出。

library(purrr)
dat <- map2(a, b, function(x, y){
map2(x, y, function(i, j){
i[["X"]] <- j[["X"]]
return(i)
})
})
dat
# [[1]]
# [[1]][[1]]
#     X   Y
# 1  10 yes
# 2   3 yes
# 3   4  no
# 4   9 yes
# 5   8  no
# 6   2 yes
# 7   5  no
# 8   7  no
# 9   1 yes
# 10  6  no
# 
# [[1]][[2]]
#     X   Y
# 1   5 yes
# 2   7 yes
# 3   4  no
# 4   3 yes
# 5  10  no
# 6   2 yes
# 7   9  no
# 8   1  no
# 9   8 yes
# 10  6  no

我们也可以使用遵循相同逻辑的mapply。它生成的结果与map2解决方案相同。

dat2 <- mapply(function(x, y){
mapply(function(i, j){
i[["X"]] <- j[["X"]]
return(i)
}, x, y, SIMPLIFY = FALSE)
}, a, b, SIMPLIFY = FALSE)
identical(dat, dat2)
# [1] TRUE

首先让我感到困惑的是,您的示例列表包含不必要的图层。直接阅读您的列表并称它们为list_1和list_2

,您将获得:
  • list_1(包含(>长度为一(包含(的列表>两个数据帧
  • list_2(包含(>长度为一(包含(的列表>两个数据帧

但是,更常见的用例可能如下:

  • list_1(包含(>两个数据帧
  • list_2(包含(>两个数据帧

由于没有迹象表明我描述为"长度一列表"的层对于您的示例是必需的,因此我使用

list_1 <- list_1[[1]]
list_2 <- list_2[[1]]

然后,您可以省去 map2 的双重应用,只需使用 dplyr 包中的 mutate

即可
purrr::map2(list_1, list_2, function(l1, l2){
dplyr::mutate(l1, X = l2$X)
})

最新更新