保存 4D 张量的最佳文件类型是什么?



我需要为3D卷积网络的后续步骤进行预处理。数据以如下格式的文件形式提供:

POSITION
x     y     z     (feature 1 x) (feature 1 y) (feature 1 z) (feature 2 x) (feature 2 y ...
1.2   0.54  2.3    0.04          0.2          -0.9           -0.2         0.65 ...
...(more rows of the same format)...

在涉及对位置数据和特征进行操作的其他一些步骤之后,我得到了一个维度为[height][width][depth][features]的 pytorch 张量,或者等效于 numpy 数组,其中前三个是位置数据,我可以用来使用颜色绘制特征,[features]是包含每个特征值的向量。

这些是非常大的文件,我不想在稍后的处理过程中执行从上面显示的第一种文件格式到张量/数组形式的转换。我正在考虑使用torch.save(tensor, 'file.pt').

我的问题是:保存此数据的最佳文件格式是什么,以便以后可以轻松访问而无需任何预处理?必须使用 PyTorch 对其进行序列化似乎是一种非常复杂的方法来保存我希望具有更具体/指定文件格式

的数据类型。

我想我已经找到了一种更直接的方法。Numpy 支持将其数组另存为.npy文件。

该过程非常简单。要将数组array_1保存到文件numpy_array_1.npy中,您需要做的就是:

np.save('numpy_array_1.npy', array_l)

然后将其加载到array_2

array_2 = np.load('numpy_array_1.npy')

最新更新