我有一个由x,y,z值组成的规则矩形网格(图像(。
我还有一条与网格相交的 x、y、z 线。
对于网格中的每个平面(z 水平(,我想计算网格中每个点与线与该网格的交点之间的欧氏距离。
例:
# create regular 3D array of values
vec <- array(1:21,c(21,21,21))
dimnames(vec) = list(seq(-10,10), seq(-10,10), seq(-10,10))
# convert to data.frame (with names x, y, z, value)
grid <- melt(vec, varnames=c("x","y","z"))
# and a set of points along a line
line <- data.frame(
x = seq(-10, 10),
y = seq(-10, 10),
z = seq(-10, 10)
)
我尝试了一些方法,并决定在 z 值上使用for
循环。
溶液:
# loop through each z-level to compute the euclidean distance between
# all points on the plane at that level, and
# the point on the line at that level.
tmp = data.frame()
for(i in line$z) {
point <- subset(line, z == i)
plane <- subset(grid, z == i)
plane$euclidean = (plane$x - point$x)^2 + (plane$y - point$y)^2
if(nrow(tmp) == 0) {
tmp = plane
} else {
tmp = rbind(tmp, plane)
}
}
我对这个解决方案不是特别满意,即使它相对较快。我不喜欢我必须拆分和重新组合数据集导致新的排序/排序的想法,并且当我在 r 中求助于for
循环时,我觉得我做错了什么。
我有一种强烈的感觉,这种方式有些低效,并且可能还有其他(更好?(方法可以使用以下一种或多种方法来做到这一点:
- 没有
for
循环、subset
和rbind
方法。 - 使用线性代数
- 使用其中一个
apply
函数 - 使用空间数据类型和函数
sp::spDistsN1()
另一种解决方案是在 z 值上merge
网格和线条,然后执行直接计算,但merge
步骤非常慢,并且由于列名重复,生成的 data.frame 中的 x、y、z 列被重命名。
更新澄清:
- 尽管图像的每个点(像素(的值对于距离的计算并不重要,但稍后需要它,并且应该随身携带。
- 与我自己的解决方案一样,我需要分配给每个 x,y,z 点的距离值。所以输出应该包括(x,y,z,值,欧几里得(,但不一定需要是一个
data.frame
。
这是我tidyverse
尝试,尽管它是否真的比你的方法更清晰,并不明显。从概念上讲,我认为它基本上是相同的:对于每个z
计算该z
的线点与所有其他点之间的距离。
- 将数组强制到数据帧(这种方式与
melt
基本相同( - 创建一个函数,该函数使用
dist
来计算点和矩阵之间的距离。dist
实际上是在矩阵的所有行之间进行计算的,因此我们只想保留结果距离三角形的底行。但是,它可能仍然比手动进行欧几里得距离快。 nest
数据,所以我们每z
有一行,x
和y
作为列表列中的数据帧left_join
线点,然后使用pmap
应用我们的新功能unnest
退后,所以我们有网格中x
、y
、z
点的列,px
和py
是线交点,distance
是到点的距离。 网格中每个点一行。
vec <- array(1:21,c(21,21,21))
dimnames(vec) = list(x = seq(-10,10), y = seq(-10,10), z = seq(-10,10))
library(tidyverse)
grid <- vec %>% # same thing as melt basically
as.tbl_cube(met_name = "value") %>%
as_tibble()
line <- data.frame(
px = seq(-10, 10),
py = seq(-10, 10),
pz = seq(-10, 10)
)
my_dist <- function(point_x, point_y, mat){
point_mat <- rbind(c(point_x, point_y), mat)
dist_mat <- as.matrix(dist(point_mat))
dist_vec <- dist_mat[nrow(dist_mat), 1:(ncol(dist_mat) - 1)]
attributes(dist_vec) <- NULL
return(dist_vec)
}
grid %>%
select(-value) %>%
nest(x, y) %>% # One row per z
left_join(line, by = c("z" = "pz")) %>%
mutate(distance = pmap(list(px, py, data), my_dist)) %>%
unnest() # Expand back out to one row per point
#> # A tibble: 9,261 x 6
#> z px py distance x y
#> <int> <int> <int> <dbl> <int> <int>
#> 1 -10 -10 -10 28.3 -10 -10
#> 2 -10 -10 -10 28.3 -9 -10
#> 3 -10 -10 -10 27.6 -8 -10
#> 4 -10 -10 -10 26.9 -7 -10
#> 5 -10 -10 -10 26.2 -6 -10
#> 6 -10 -10 -10 25.6 -5 -10
#> 7 -10 -10 -10 25 -4 -10
#> 8 -10 -10 -10 24.4 -3 -10
#> 9 -10 -10 -10 23.9 -2 -10
#> 10 -10 -10 -10 23.3 -1 -10
#> # ... with 9,251 more rows
创建于 2018-09-18 由 reprex 包 (v0.2.0(.