从 np 随机选择中获取数组,避免循环和错误"a must be 1-dimensional"



我正试图找到一种方法,在不使用循环的情况下,使用值矩阵和概率矩阵从np.random.choise中获得一组值。

想象一下我有这样的

vals=  array([[ 0.        ,  1.22222222,  2.44444444,  3.66666667,  4.88888889,
6.11111111,  7.33333333,  8.55555556,  9.77777778, 11.        ],
[ 3.        ,  8.22222222, 13.44444444, 18.66666667, 23.88888889,
29.11111111, 34.33333333, 39.55555556, 44.77777778, 50.        ]])
probs= array([[0.01056171, 0.15521083, 0.07796945, 0.09986356, 0.14516427,
0.12496125, 0.00091384, 0.19739258, 0.00088116, 0.18708136],
[0.01220221, 0.17791623, 0.13682813, 0.05679157, 0.16599396,
0.09769565, 0.09365478, 0.15176203, 0.0965629 , 0.01059253]])

我怎样才能得到与这个等效的数组

[np.random.choice(vals[i],p=probs[i]) for i in range(len(probs))]
out[1]: 
[6.111111111111112, 23.88888888888889]

而不使用for循环??

我本以为np.random.chice会逐行广播矩阵,但我得到了错误";a必须是一维的";。

我注意到问题按行的总和仅为1.0,因此不需要归一化。

要计算结果,请定义以下函数:

def rndFromRows(arr, probs):
rowIdx = np.arange(arr.shape[0])
colIdx = (probs.cumsum(1) > np.random.rand(probs.shape[0])[:,None]).argmax(1)
return arr[(rowIdx, colIdx)]

或者更简洁的版本:

def rndFromRows(arr, probs):
return arr[(np.arange(arr.shape[0]), (probs.cumsum(1) >
np.random.rand(probs.shape[0])[:,None]).argmax(1))]

然后计算结果为:

np.random.seed(0)    # To get a repeatable result
result = rndFromRows(vals, probs)

我使用%timeit比较了执行时间,发现我的代码运行比你的快5倍。自己比较。

结果是:

array([ 6.11111111, 34.33333333])

当然,在代码的最终版本中,删除随机生成器。

最新更新