我正试图找到一种方法,在不使用循环的情况下,使用值矩阵和概率矩阵从np.random.choise中获得一组值。
想象一下我有这样的
vals= array([[ 0. , 1.22222222, 2.44444444, 3.66666667, 4.88888889,
6.11111111, 7.33333333, 8.55555556, 9.77777778, 11. ],
[ 3. , 8.22222222, 13.44444444, 18.66666667, 23.88888889,
29.11111111, 34.33333333, 39.55555556, 44.77777778, 50. ]])
probs= array([[0.01056171, 0.15521083, 0.07796945, 0.09986356, 0.14516427,
0.12496125, 0.00091384, 0.19739258, 0.00088116, 0.18708136],
[0.01220221, 0.17791623, 0.13682813, 0.05679157, 0.16599396,
0.09769565, 0.09365478, 0.15176203, 0.0965629 , 0.01059253]])
我怎样才能得到与这个等效的数组
[np.random.choice(vals[i],p=probs[i]) for i in range(len(probs))]
out[1]:
[6.111111111111112, 23.88888888888889]
而不使用for循环??
我本以为np.random.chice会逐行广播矩阵,但我得到了错误";a必须是一维的";。
我注意到问题按行的总和仅为1.0,因此不需要归一化。
要计算结果,请定义以下函数:
def rndFromRows(arr, probs):
rowIdx = np.arange(arr.shape[0])
colIdx = (probs.cumsum(1) > np.random.rand(probs.shape[0])[:,None]).argmax(1)
return arr[(rowIdx, colIdx)]
或者更简洁的版本:
def rndFromRows(arr, probs):
return arr[(np.arange(arr.shape[0]), (probs.cumsum(1) >
np.random.rand(probs.shape[0])[:,None]).argmax(1))]
然后计算结果为:
np.random.seed(0) # To get a repeatable result
result = rndFromRows(vals, probs)
我使用%timeit比较了执行时间,发现我的代码运行比你的快5倍。自己比较。
结果是:
array([ 6.11111111, 34.33333333])
当然,在代码的最终版本中,删除随机生成器。