优化两两L2距离计算



我需要帮助来优化这个循环。matrix_1是(n × 2) int矩阵,matrix_2是(m × 2), m &n

index_j = 1;
for index_k = 1:size(Matrix_1,1)
    for index_l = 1:size(Matrix_2,1)
        M2_Index_Dist(index_j,:) = [index_l, sqrt(bsxfun(@plus,sum(Matrix_1(index_k,:).^2,2),sum(Matrix_2(index_l,:).^2,2)')-2*(Matrix_1(index_k,:)*Matrix_2(index_l,:)'))];
        index_j = index_j + 1;
    end
 end

我需要M2_Index_Dist提供一个((n*m) x 2)矩阵,其中matrix_2的索引在第一列,距离在第二列。

输出示例:

M2_Index_Dist = [ 1, 5.465
                  2, 56.52
                  3, 6.21
                  1, 35.3
                  2, 56.52
                  3, 0
                  1, 43.5
                  2, 9.3
                  3, 236.1
                  1, 8.2
                  2, 56.52
                  3, 5.582]

如何将bsxfun应用于公式(||A-B|| = sqrt(||A||^2 + ||B||^2 - 2*A*B)):

d = real(sqrt(bsxfun(@plus, dot(Matrix_1,Matrix_1,2), ...
    bsxfun(@minus, dot(Matrix_2,Matrix_2,2).', 2 * Matrix_1*Matrix_2.')))).';

如果你改变对矩阵的解释,你可以避免最后的转置。

注意:real不应该有任何复杂的值来处理,但它在非常小的差异可能导致微小的负数的情况下存在。


编辑:没有dot可能会更快:

d = sqrt(bsxfun(@plus, sum(Matrix_1.*Matrix_1,2), ...
    bsxfun(@minus, sum(Matrix_2.*Matrix_2,2)', 2 * Matrix_1*Matrix_2.'))).';

或者只调用一次bsxfun:

d = sqrt(bsxfun(@plus, sum(Matrix_1.*Matrix_1,2), sum(Matrix_2.*Matrix_2,2)') ...
    - 2 * Matrix_1*Matrix_2.').';

注意:最后一个顺序的操作会给你相同的结果,而不是错误~1e-14


编辑2:复制M2_Index_Dist:
II = ndgrid(1:size(Matrix_2,1),1:size(Matrix_2,1));
M2_Index_Dist = [II(:) d(:)];

如果我理解正确的话,这就是你想要的:

ind = repmat((1:size(Matrix_2,1)).',size(Matrix_1,1),1); %'// first column: index
d = pdist2(Matrix_2,Matrix_1); %// compute distance between each pair of rows
d = d(:); %// second column: distance
result = [ind d]; %// build result from first column and second column

如您所见,这段代码调用pdist2来计算矩阵中每对行之间的距离。默认情况下,该函数使用欧几里德距离。

如果您没有pdist2(这是统计工具箱的一部分),您可以将上面的第2行替换为bsxfun:

d = squeeze(sqrt(sum(bsxfun(@minus,Matrix_2,permute(Matrix_1, [3 2 1])).^2,2)));

相关内容

  • 没有找到相关文章

最新更新