i具有一个大矩阵,该矩阵正在计算两个不同的邮政编码之间的距离(使用rgeosphere
软件包)。我想运行一个函数,该函数可以找到所有< = x距离距离距离并创建它们列表的ZIP代码配对。数据看起来像这样:
91423 92231 94321
90034 3 4.5 2.25
93201 3.75 2.5 1.5
94501 2 6 0.5
因此,如果我运行了该功能以提取所有位于2英里外的邮政编码配对,我将最终使用这些邮政编码:
94321
94321
93201
94501
基本上,目标是将美国的所有相邻邮政编码识别为我拥有的邮政编码列表。如果有更好的方法来做到这一点,我对建议。
也许类似以下内容。它会很慢,但是应该起作用。
for(i in 1:nrow(data)){
for (j in 1:ncol(data)){
if(data[i,j]<distance){
if(exists(hold.zips)==FALSE){
hold.zips<-matrix(c(colnames(data)[i],colnames(data)[j]),ncol=2)
}else{
temp<-matrix(c(colnames(data)[i],colnames(data)[j]),ncol=2)
hold.zips<-rbind(hold.zips,temp)
}
}
}
}
这应该起作用。给出一个不错的list
作为输出(调用数据x
):
rn = rownames(x)
apply(x, 2, function(z) rn[z < 2])
# $`91423`
# character(0)
#
# $`92231`
# character(0)
#
# $`94321`
# [1] "93201" "94501"
这是整理解决方案:
library(dplyr)
library(tidyr)
# your data
dat <- matrix(c(3,3.75,2,4.5,2.5,6,2.25,1.5,0.5), nrow = 3, ncol = 3)
rownames(dat) <- c(90034, 93201, 94501)
colnames(dat) <- c(91423, 92231, 94321)
# tidyverse solution
r <- rownames(dat)
dat_tidy <- dat %>%
as_tibble() %>%
mutate(x = r) %>%
select(x, everything()) %>%
gather(key = y,
value = distance,
-x) %>%
filter(distance < 2)
print(dat_tidy)
# note if your matrix is a symetric matrix then
# to remove duplicates, filter would be:
# filter(x < y,
# distance < 2)