为两个不规则网格之间的多次插值加速scipy网格数据



我在同一个不规则网格(x, y, z)上定义了几个值,我想将这些值插值到新网格(x1, y1, z1)上。即我具有f(x, y, z), g(x, y, z), h(x, y, z)并且我想要计算f(x1, y1, z1), g(x1, y1, z1), h(x1, y1, z1)

目前我正在使用scipy.interpolate.griddata进行此操作,它运行良好。然而,因为我必须单独执行每个插值,而且有很多点,所以它非常慢,在计算中有很多重复(即找到最接近的点,设置网格等)。

有没有办法加快计算速度,减少重复计算?即沿着定义两个网格的线,然后更改插值的值?

每次调用scipy.interpolate.griddata:时都会发生一些事情

  1. 首先,调用sp.spatial.qhull.Delaunay对不规则网格坐标进行三角测量
  2. 然后,对于新网格中的每个点,都会搜索三角测量,以找到它位于哪个三角形中(实际上,它位于哪个单纯形中,在3D情况下,它将位于哪个四面体中)
  3. 计算每个新网格点相对于封闭单纯形顶点的重心坐标
  4. 使用重心坐标和封闭单纯形顶点处的函数值计算该网格点的插值

所有插值的前三个步骤都是相同的,因此,如果您可以为每个新的网格点存储封闭单纯形的顶点索引和插值的权重,您将大大减少计算量。不幸的是,使用可用的功能直接做到这一点并不容易,尽管这确实是可能的:

import scipy.interpolate as spint
import scipy.spatial.qhull as qhull
import itertools
def interp_weights(xyz, uvw):
tri = qhull.Delaunay(xyz)
simplex = tri.find_simplex(uvw)
vertices = np.take(tri.simplices, simplex, axis=0)
temp = np.take(tri.transform, simplex, axis=0)
delta = uvw - temp[:, d]
bary = np.einsum('njk,nk->nj', temp[:, :d, :], delta)
return vertices, np.hstack((bary, 1 - bary.sum(axis=1, keepdims=True)))
def interpolate(values, vtx, wts):
return np.einsum('nj,nj->n', np.take(values, vtx), wts)

函数interp_weights对上面列出的前三个步骤进行计算。然后函数interpolate使用这些计算值非常快地执行步骤4:

m, n, d = 3.5e4, 3e3, 3
# make sure no new grid point is extrapolated
bounding_cube = np.array(list(itertools.product([0, 1], repeat=d)))
xyz = np.vstack((bounding_cube,
np.random.rand(m - len(bounding_cube), d)))
f = np.random.rand(m)
g = np.random.rand(m)
uvw = np.random.rand(n, d)
In [2]: vtx, wts = interp_weights(xyz, uvw)
In [3]: np.allclose(interpolate(f, vtx, wts), spint.griddata(xyz, f, uvw))
Out[3]: True
In [4]: %timeit spint.griddata(xyz, f, uvw)
1 loops, best of 3: 2.81 s per loop
In [5]: %timeit interp_weights(xyz, uvw)
1 loops, best of 3: 2.79 s per loop
In [6]: %timeit interpolate(f, vtx, wts)
10000 loops, best of 3: 66.4 us per loop
In [7]: %timeit interpolate(g, vtx, wts)
10000 loops, best of 3: 67 us per loop

因此,首先,它与griddata做得一样,这很好。其次,设置插值,即计算vtxwts所花费的时间与调用griddata大致相同。但第三,您现在可以在几乎很短的时间内对同一网格上的不同值进行插值。

griddata所做的唯一没有考虑到的事情是将fill_value分配给必须外推的点。你可以通过检查至少有一个权重为负的点来做到这一点,例如:

def interpolate(values, vtx, wts, fill_value=np.nan):
ret = np.einsum('nj,nj->n', np.take(values, vtx), wts)
ret[np.any(wts < 0, axis=1)] = fill_value
return ret

非常感谢Jaime的解决方案(即使我真的不了解重心计算是如何完成的…)

在这里,你会发现一个改编自他的2D案例的例子:

import scipy.interpolate as spint
import scipy.spatial.qhull as qhull
import numpy as np
def interp_weights(xy, uv,d=2):
tri = qhull.Delaunay(xy)
simplex = tri.find_simplex(uv)
vertices = np.take(tri.simplices, simplex, axis=0)
temp = np.take(tri.transform, simplex, axis=0)
delta = uv - temp[:, d]
bary = np.einsum('njk,nk->nj', temp[:, :d, :], delta)
return vertices, np.hstack((bary, 1 - bary.sum(axis=1, keepdims=True)))
def interpolate(values, vtx, wts):
return np.einsum('nj,nj->n', np.take(values, vtx), wts)
m, n = 101,201
mi, ni = 1001,2001
[Y,X]=np.meshgrid(np.linspace(0,1,n),np.linspace(0,2,m))
[Yi,Xi]=np.meshgrid(np.linspace(0,1,ni),np.linspace(0,2,mi))
xy=np.zeros([X.shape[0]*X.shape[1],2])
xy[:,0]=Y.flatten()
xy[:,1]=X.flatten()
uv=np.zeros([Xi.shape[0]*Xi.shape[1],2])
uv[:,0]=Yi.flatten()
uv[:,1]=Xi.flatten()
values=np.cos(2*X)*np.cos(2*Y)
#Computed once and for all !
vtx, wts = interp_weights(xy, uv)
valuesi=interpolate(values.flatten(), vtx, wts)
valuesi=valuesi.reshape(Xi.shape[0],Xi.shape[1])
print "interpolation error: ",np.mean(valuesi-np.cos(2*Xi)*np.cos(2*Yi))  
print "interpolation uncertainty: ",np.std(valuesi-np.cos(2*Xi)*np.cos(2*Yi))  

可以应用图像变换,例如使用udge加速的图像映射

你不能使用相同的函数定义,因为新坐标在每次迭代时都会改变,但你可以一次性计算三角测量。

import scipy.interpolate as spint
import scipy.spatial.qhull as qhull
import numpy as np
import time
# Definition of the fast  interpolation process. May be the Tirangulation process can be removed !!
def interp_tri(xy):
tri = qhull.Delaunay(xy)
return tri

def interpolate(values, tri,uv,d=2):
simplex = tri.find_simplex(uv)
vertices = np.take(tri.simplices, simplex, axis=0)
temp = np.take(tri.transform, simplex, axis=0)
delta = uv- temp[:, d]
bary = np.einsum('njk,nk->nj', temp[:, :d, :], delta)  
return np.einsum('nj,nj->n', np.take(values, vertices),  np.hstack((bary, 1.0 - bary.sum(axis=1, keepdims=True))))
m, n = 101,201
mi, ni = 101,201
[Y,X]=np.meshgrid(np.linspace(0,1,n),np.linspace(0,2,m))
[Yi,Xi]=np.meshgrid(np.linspace(0,1,ni),np.linspace(0,2,mi))
xy=np.zeros([X.shape[0]*X.shape[1],2])
xy[:,1]=Y.flatten()
xy[:,0]=X.flatten()
uv=np.zeros([Xi.shape[0]*Xi.shape[1],2])
# creation of a displacement field
uv[:,1]=0.5*Yi.flatten()+0.4
uv[:,0]=1.5*Xi.flatten()-0.7
values=np.zeros_like(X)
values[50:70,90:150]=100.
#Computed once and for all !
tri = interp_tri(xy)
t0=time.time()
for i in range(0,100):
values_interp_Qhull=interpolate(values.flatten(),tri,uv,2).reshape(Xi.shape[0],Xi.shape[1])
t_q=(time.time()-t0)/100
t0=time.time()
values_interp_griddata=spint.griddata(xy,values.flatten(),uv,fill_value=0).reshape(values.shape[0],values.shape[1])
t_g=time.time()-t0
print "Speed-up:", t_g/t_q
print "Mean error: ",(values_interp_Qhull-values_interp_griddata).mean()
print "Standard deviation: ",(values_interp_Qhull-values_interp_griddata).std()

在我的笔记本电脑上,速度在20到40倍之间!

希望能帮助

我也遇到了同样的问题(网格数据非常慢,网格在许多插值中都保持不变),我最喜欢这里描述的解决方案,主要是因为它非常容易理解和应用。

它使用LinearNDInterpolator,其中可以通过只需要计算一次的Delaunay三角测量。复制&从该帖子粘贴(所有学分到xdze2):

from scipy.spatial import Delaunay
from scipy.interpolate import LinearNDInterpolator
tri = Delaunay(mesh1)  # Compute the triangulation
# Perform the interpolation with the given values:
interpolator = LinearNDInterpolator(tri, values_mesh1)
values_mesh2 = interpolator(mesh2)

这使我的计算速度提高了大约2倍。

您可以尝试使用Pandas,因为它提供了高性能的数据结构。

的确,插值方法是scipy插值的包装器,但通过改进结构,您可能会获得更好的速度。

import pandas as pd;
wp = pd.Panel(randn(2, 5, 4));
wp.interpolate();

interpolate()使用不同的方法填充Panel数据集中的NaN值。希望它比Scipy快。

如果它不起作用,有一种方法可以提高性能(而不是使用代码的并行版本):使用Cython并在C中实现小例程,以便在Python代码中使用。这里有一个例子。

最新更新