给定一个列表列表,其中每个列表的长度
M = [[1,2,3,4,4,5,1,2,9,0], [3,2,1,0,5,6,2,4,6,7], [4,5,5,2,1,2,3,4,2,4], [7,5,6,2,6,7,8,8,8,1] ]
我想计算一个元素的重复次数并将其输入到一个单独的矩阵中。
让我们将每个列表称为frame
,将框架中的元素称为states
。
这是我的代码,它工作正常:
import numpy as np
from collections import Counter
import numpy as np
from xarray import DataArray
def Vfinal(s_t,Matrix):
state_no = np.arange(0,s_t)
frame_no = np.arange(0,len(Matrix))
V= DataArray(np.zeros(( len(state_no),len(Matrix) )), coords=[('States_count', state_no), ('Frame',frame_no)])
for i,j in enumerate(Matrix):
for k in j:
print(k,i)
V.loc[k,i] +=1
return V
In [172]: V = Vfinal(10,M)
In [173]: V
Out[173]:
<xarray.DataArray (States_count: 10, Frame: 4)>
array([[ 1., 1., 0., 0.],
[ 2., 1., 1., 1.],
[ 2., 2., 3., 1.],
[ 1., 1., 1., 0.],
[ 2., 1., 3., 0.],
[ 1., 1., 2., 1.],
[ 0., 2., 0., 2.],
[ 0., 1., 0., 2.],
[ 0., 0., 0., 3.],
[ 1., 0., 0., 0.]])
Coordinates:
* States_count (States_count) int64 0 1 2 3 4 5 6 7 8 9
* Frame (Frame) int64 0 1 2 3
就我而言,列表M
有28,800 lists
,每个列表包含 75 个元素(数字介于 0 到 499 之间)。
这使得矩阵的大小为 500X 28,800。代码需要 30 分钟(大约)才能完成,我相信问题出在for
循环中。
有没有有效的方法来编写它,以便代码可以更快地执行?
我将函数Vfinal
更改为Vfinal2
。
这使代码更快
def Vfinal2(s_t,Matrix):
V = np.zeros((s_t,len(Matrix)))
for i,row in enumerate(Matrix):
a = np.bincount(row)
b=np.zeros(s_t)
b[:len(a)]=a
V[:,i]=b
return V