我有一个pandas
DataFrame
,其中行表示对称矩阵分量。
sxx syy szz sxy syz sxz
NodeID time
1500000 20921.0 2504729.0 -16524560.0 -3966213.0 5058878.0 8026349.0 390275.7
20923.0 2541577.0 -16459500.0 -3930280.0 5047995.0 8019404.0 393201.3
20925.0 2582004.0 -16384690.0 -3891037.0 5035703.0 8011226.0 396850.2
20927.0 2618859.0 -16313310.0 -3855520.0 5024095.0 8003384.0 400578.7
20933.0 2703961.0 -16133460.0 -3773937.0 4995101.0 7985394.0 411183.2
矩阵将如下所示。
[[sxx, sxy, sxz],
[sxy, syy, syz],
[sxz, syz, szz]]
计算每行特征值的最快方法是什么?
我尝试在每一行上"应用"np.linalg.eigvalsh
。但是,当我有接近一百万行时,需要很长时间。
编辑
为了提供完整的上下文,我还应该提到这个DataFrame
是对象定义的一部分。object.df
是DataFrame
.下面是相关代码。
def s1(self):
"""Returns the first principal stress for every node every timepoint"""
return self.df.apply(principal, axis=1, label="s1")
def principal(s, label):
principals = np.linalg.eigvalsh(
np.array(
[s.sxx, s.sxy, s.sxz, s.sxy, s.syy, s.syz, s.sxz, s.syz, s.szz]
).reshape(3, 3)
)
if label.lower() == "s3":
return principals[0]
elif label.lower() == "s2":
return principals[1]
elif label.lower() == "s1":
return principals[2]
else:
raise ValueError("Invalid Input, choose from s1, s2, or s3.")
您可以设置列的顺序以生成视图,然后使用.values
将其传递给数组(比np.array(..)
更快),然后将eigvalsh
应用于(n, 3, 3)
数组:
values = df[['sxx', 'sxy', 'sxz', 'sxy', 'syy', 'syz', 'sxz', 'syz', 'szz']].values.reshape(-1,3))
eigh = eigvalsh(values.reshape((-1, 3, 3)))
eigh
>>array([[-21253030.07083309, -1397298.11167328, 4664284.18250638],
[-21184732.23304478, -1361435.36228467, 4697964.59532944],
[-21106512.77176102, -1322433.70013306, 4735223.47189408],
[-21032246.72681734, -1287171.41922922, 4769447.14604654],
[-20847979.70886149, -1205613.19093403, 4850156.89979552]])