在numba中,array(float64, 1d, C)和array(float64, 1d, A)有什么区别?



我有两个简单而相似的函数。一个可以用numba编译,而另一个不能。我不明白它们之间的区别。以下是这两个函数:

第一个:

@nb.njit(float64[:](float64[:], float64[:]))
def arrAdd(a,b):
assert a.shape == b.shape
return a + b

编译成功。当我调用它时

arrAdd(np.array([1,2.0,21]),np.array([2,3.0,1]))

它将返回:

array([ 3.,  5., 22.])

第二个:

c = np.array([1,2.0,21])
@nb.njit
def arrAdd1(arr):
return arrAdd(arr,c)

然而,当我调用这个函数时:

arrAdd1([2,3.0,1])

显示:

TypingError: Failed in nopython mode pipeline (step: nopython frontend)
Invalid use of type(CPUDispatcher(<function arrAdd at 0x00000212A9FDC670>)) with parameters (array(float64, 1d, C), readonly array(float64, 1d, C))
Known signatures:
* (array(float64, 1d, A), array(float64, 1d, A)) -> array(float64, 1d, A)
During: resolving callee type: type(CPUDispatcher(<function arrAdd at 0x00000212A9FDC670>))
During: typing of call at <ipython-input-57-c77e552c5560> (4)

File "<ipython-input-57-c77e552c5560>", line 4:
def arrAdd1(arr):
return arrAdd(arr, c)
^

那么array(float64, 1d, C)和array(float64, 1d, A)之间的区别是什么呢?

A (any), C (C-连续)和F (fortrans -连续)是数组布局的三种类型。但这不是你的例子中的问题。

问题1

在这一行

arrAdd1([2,3.0,1])

你正在传递一个列表而不是数组。

下面的简化版本可以工作:

@nb.njit                            # No types
def arrAdd(a, b):
assert a.shape == b.shape
return a + b
a = arrAdd(np.array([1, 2.0, 21]), np.array([2, 3.0, 1]))
print(a)
c = np.array([1, 2.0, 21])
@nb.njit                            # No types
def arrAdd1(arr):
return arrAdd(arr, c)
a = arrAdd1(np.array([2,3.0,1]))    # Pass an array
print(a)

,

[ 3.  5. 22.]
[ 3.  5. 22.]

问题2

在您的示例中,arrAdd1()被定义为闭包,因此c成为函数中的常数。

如果你真的想使用显式的参数类型,你需要指定addArr()将至少在第二个参数中接收一个常量数组。

只要函数不修改它们的输入,就可以将所有的输入参数声明为只读,如下例所示,这样可以产生相同的结果:

vector = nb.types.Array(dtype=f8, ndim=1, layout="A")
readonly_vector = nb.types.Array(dtype=f8, ndim=1, layout="A", readonly=True)
@nb.njit(vector(readonly_vector, readonly_vector))
def arrAdd(a, b):
assert a.shape == b.shape
return a + b
a = arrAdd(np.array([1, 2.0, 21]), np.array([2, 3.0, 1]))
print(a)
c = np.array([1, 2.0, 21])
@nb.njit(vector(readonly_vector))
def arrAdd1(arr):
return arrAdd(arr, c)
a = arrAdd1(np.array([2,3.0,1]))
print(a)

你可以改变布局(A, C, F)到最适合你的。

最新更新