使用Pandas来表示2D数据序列-使用什么结构



我正在分析脚压,其中每个读数是一个52x44矩阵,完整捕获是这些2D读数的时间序列。

这可以很容易地用形状为(52x44xN)的Numpy数组表示,其中N取决于采样率和捕获的持续时间。使用Numpy,我已经可以执行我需要的所有操作(主要是切片和简单的描述性统计)。

我对探索Pandas在这方面的能力很感兴趣,但是我想知道什么是合适的列名和结构。

对于Numpy 3D数组,我有索引I, J和N。如果我使用N作为Pandas DataFrame的索引,我将使用什么作为数据列?我觉得使用I, J和V (value)作为列很奇怪,因为这会创建显式(和冗余)索引值,实际上使用(3 x (52*44*N))形矩阵。

现在,如果我把一个数组作为列值,3D切片("框"选择)将是有问题的,不是吗?

(编辑)我已经看到了一些关于MultiIndex,但我不确定如何使用它。

你有什么建议?

也许可以尝试使用Pandas Panel来处理三维数据。

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Panel.html

为方便其他人参考,您可以在这里找到1D (Series), 2D (Dataframe)和3D (Panel) Pandas结构的信息:

http://pandas.pydata.org/pandas-docs/stable/dsintro.html

最新更新