我有一个由多个数据帧组成的列表,我想对该列表进行迭代,并提取每个数据帧的"第n"列,并将所有这些元素并排分组到一个数据帧上。
考虑一下我需要拉这个列表的第二列:
library(tidyverse)
mylist <- list(mt1 = mtcars, mt2 = mtcars*2, mt3 = mtcars*3)
我想要一个类似的结果,使用cbind:
> mylist[[1]][2] %>%
+ cbind(mylist[[2]][2]) %>%
+ cbind(mylist[[3]][2]) %>%
+ head()
cyl cyl cyl
Mazda RX4 6 12 18
Mazda RX4 Wag 6 12 18
Datsun 710 4 8 12
Hornet 4 Drive 6 12 18
Hornet Sportabout 8 16 24
Valiant 6 12 18
但我需要一个可以迭代任意数量列表元素的代码。我不需要根据列表元素的数量进行重写。我怎样才能做到这一点?
我可以使用for循环,但输出与我需要的不同:
for (i in seq_along(mylist)){
print(mylist[[i]] %>% select(2))
}
与sapply或lapply相同:
sapply(mylist, function(x) x%>% select(2))
lapply(mylist, function(x) x%>% select(2))
使用map_df,我得到一个数据帧,但每一行都在另一行的顶部:
> map_df(mylist, function(x) x%>% select(2)) %>%
+ head()
cyl
Mazda RX4...1 6
Mazda RX4 Wag...2 6
Datsun 710...3 4
Hornet 4 Drive...4 6
Hornet Sportabout...5 8
Valiant...6 6
如何从列表上的每个数据帧中提取列,并将每个列并排排列?
您可以使用map_dfc
而不是map_df
,因为它将绑定列。
library(tidyverse)
map_dfc(mylist, select, 2) %>%
head()
# cyl...1 cyl...2 cyl...3
#Mazda RX4 6 12 18
#Mazda RX4 Wag 6 12 18
#Datsun 710 4 8 12
#Hornet 4 Drive 6 12 18
#Hornet Sportabout 8 16 24
#Valiant 6 12 18
此外,如果我们想分配一个名称(例如,为每列添加一个序列号(,那么我们可以使用map2_dfc
。您也可以传递一组不同的名称。
map2_dfc(mylist,
1:length(mylist),
(x, y) x %>% select(2) %>% rename(!!paste0(names(.)[1], y, sep = "") := 1)) %>%
head()
# cyl1 cyl2 cyl3
#Mazda RX4 6 12 18
#Mazda RX4 Wag 6 12 18
#Datsun 710 4 8 12
#Hornet 4 Drive 6 12 18
#Hornet Sportabout 8 16 24
#Valiant 6 12 18
基本R选项-
do.call(cbind.data.frame, lapply(mylist, `[[`, 2))
# mt1 mt2 mt3
#1 6 12 18
#2 6 12 18
#3 4 8 12
#4 6 12 18
#5 8 16 24
#6 6 12 18
#7 8 16 24
#8 4 8 12
#9 4 8 12
#10 6 12 18
#11 6 12 18
#...
#...
以下是我的操作方法:
library(dplyr)
variable_number_to_get <- 2
newList <- lapply(mylist, function (x) x %>% select(variable_number_to_get)
bind_cols(newList)
气缸。。。1气缸…2气缸…3马自达RX4 6 12 18马自达RX4 Wag 6 12 18Datsun 710 4 8 12Hornet 4 Drive 6 12 18Hornet Sportabout 8 16 24…