r语言 - 我有一个从数据框中提取的子集矩阵,如何获取相应的行名?


A=data.frame(Lat=(1:5),long=(6:10))
rownames(A)<-c("a","b","c","d","e")
B=matrix(c(2,7,4,9),nrow=2,ncol=2, byrow=TRUE)

如何从数据框 A 获取矩阵 B 的相应行名"b"和"d"?

您可以使用包prodlim中的函数row.match,这非常易于使用。它返回一个行号为(第一个)匹配项的向量,否则NA。您可以使用该向量(在本例中m)来标识在B中找到匹配项的A的行名。

library(prodlim)
m <- row.match(A, B)
rownames(A)[!is.na(m)]
#[1] "b" "d"

如果我们逐个比较,则将"A"转换为matrix,检查元素是否%in%B,将逻辑向量转换为matrix,获取带有which/arr.ind=TRUE的行索引,并在此基础上找到行名。

row.names(A)[unique(which(`dim<-`(as.matrix(A) %in% B, dim(A)), arr.ind=TRUE)[,1])]
#[1] "b" "d"

或者,如果我们比较"A"和"B"中的相应列,我们可以使用mapply,获取rowSums,检查它是否为 2 并根据该索引找到行名。

row.names(A)[rowSums(mapply(function(x,y) x %in% y, A, as.data.frame(B)))==2]

或者我们可以将列paste在一起并进行比较

row.names(A)[do.call(paste, A) %in% paste(B[,1], B[,2])]
#[1] "b" "d"

注意:所有这些方法都基于base R

您可以在基本R中尝试的另一种方法

row.names(A)[A[,1] %in% B[,1] & A[,2] %in% B[,2]]
[1] "b" "d"

最新更新