从列表中提取项目并输出到R中的数据帧



我有一个由多个数据帧组成的列表,我想对该列表进行迭代,并提取每个数据帧的"第n"列,并将所有这些元素并排分组到一个数据帧上。

考虑一下我需要拉这个列表的第二列:

library(tidyverse)    
mylist <- list(mt1 = mtcars, mt2 = mtcars*2, mt3 = mtcars*3)

我想要一个类似的结果,使用cbind:

> mylist[[1]][2] %>% 
+   cbind(mylist[[2]][2]) %>% 
+   cbind(mylist[[3]][2]) %>% 
+   head()
cyl cyl cyl
Mazda RX4           6  12  18
Mazda RX4 Wag       6  12  18
Datsun 710          4   8  12
Hornet 4 Drive      6  12  18
Hornet Sportabout   8  16  24
Valiant             6  12  18

但我需要一个可以迭代任意数量列表元素的代码。我不需要根据列表元素的数量进行重写。我怎样才能做到这一点?

我可以使用for循环,但输出与我需要的不同:

for (i in seq_along(mylist)){
print(mylist[[i]] %>% select(2)) 
}

与sapply或lapply相同:

sapply(mylist, function(x) x%>% select(2))
lapply(mylist, function(x) x%>% select(2))

使用map_df,我得到一个数据帧,但每一行都在另一行的顶部:

> map_df(mylist, function(x) x%>% select(2)) %>% 
+   head()
cyl
Mazda RX4...1           6
Mazda RX4 Wag...2       6
Datsun 710...3          4
Hornet 4 Drive...4      6
Hornet Sportabout...5   8
Valiant...6             6

如何从列表上的每个数据帧中提取列,并将每个列并排排列?

您可以使用map_dfc而不是map_df,因为它将绑定列。

library(tidyverse)
map_dfc(mylist, select, 2) %>% 
head()
#                  cyl...1 cyl...2 cyl...3
#Mazda RX4               6      12      18
#Mazda RX4 Wag           6      12      18
#Datsun 710              4       8      12
#Hornet 4 Drive          6      12      18
#Hornet Sportabout       8      16      24
#Valiant                 6      12      18

此外,如果我们想分配一个名称(例如,为每列添加一个序列号(,那么我们可以使用map2_dfc。您也可以传递一组不同的名称。

map2_dfc(mylist,
1:length(mylist),
(x, y) x %>% select(2) %>% rename(!!paste0(names(.)[1], y, sep = "") := 1)) %>%
head()
#                  cyl1 cyl2 cyl3
#Mazda RX4            6   12   18
#Mazda RX4 Wag        6   12   18
#Datsun 710           4    8   12
#Hornet 4 Drive       6   12   18
#Hornet Sportabout    8   16   24
#Valiant              6   12   18

基本R选项-

do.call(cbind.data.frame, lapply(mylist, `[[`, 2))
#   mt1 mt2 mt3
#1    6  12  18
#2    6  12  18
#3    4   8  12
#4    6  12  18
#5    8  16  24
#6    6  12  18
#7    8  16  24
#8    4   8  12
#9    4   8  12
#10   6  12  18
#11   6  12  18
#...
#...

以下是我的操作方法:

library(dplyr)
variable_number_to_get <- 2
newList <- lapply(mylist, function (x) x %>% select(variable_number_to_get)
bind_cols(newList)
气缸。。。1气缸…2气缸…3马自达RX4 6 12 18马自达RX4 Wag 6 12 18Datsun 710 4 8 12Hornet 4 Drive 6 12 18Hornet Sportabout 8 16 24…

相关内容

最新更新