我正在分析脚压,其中每个读数是一个52x44矩阵,完整捕获是这些2D读数的时间序列。
这可以很容易地用形状为(52x44xN)的Numpy数组表示,其中N取决于采样率和捕获的持续时间。使用Numpy,我已经可以执行我需要的所有操作(主要是切片和简单的描述性统计)。
我对探索Pandas在这方面的能力很感兴趣,但是我想知道什么是合适的列名和结构。
对于Numpy 3D数组,我有索引I, J和N。如果我使用N作为Pandas DataFrame的索引,我将使用什么作为数据列?我觉得使用I, J和V (value)作为列很奇怪,因为这会创建显式(和冗余)索引值,实际上使用(3 x (52*44*N))形矩阵。
现在,如果我把一个数组作为列值,3D切片("框"选择)将是有问题的,不是吗?
(编辑)我已经看到了一些关于MultiIndex,但我不确定如何使用它。
你有什么建议?
也许可以尝试使用Pandas Panel
来处理三维数据。
为方便其他人参考,您可以在这里找到1D (Series
), 2D (Dataframe
)和3D (Panel
) Pandas结构的信息: