TF 求和池层 1D 与 2D

我目前正在撰写Sturm等人(2016(发表在《神经科学杂志》(Journal of Neuroscience(上的一篇论文，试图使用python和TensorFlow，Keras库复制他们的结果。

我强烈怀疑我是否理解了他们设计模型的方式，如第2.1节所述。

由于我缺乏该领域的经验，我无法完全理解以下几点。

他们是否使用了 1D 或 2D 总和池层？
每层之后的确切输出形状是什么？
他们是否使用分类格式进行输出？
他们是否使用了 dropout 和任何其他层？

您将如何设计所描述的模型？

提前感谢您的宝贵意见。

这是我对此的看法。

使用的数据集：此处和本文中的数据集

他们是否使用了 1D 或 2D 总和池层？

虽然他们没有具体说明他们在模型中使用了什么，但它应该是 1D 池化。因为EEG信号只有两个维度(时间，通道(，这是1D池化层接受的输入类型。此外，该文件说(第2.1节(，

The  first  linear  layer  accepts  an input  of  the  dimensionality  
301  time  points × 118  channels EEG features

但是他们接着说了以下内容，这有点奇怪。

Each epoch’s spatio-temporal features(301  time  points×118  channels  for  aa-ay,  
301  time  point×58  channels  for  subject  od-obx)  were  vectorized  
into  one vector with 33518 (17458) dimensions.

我猜他们在此矢量化之后添加了单个维度，以便单个输入具有 2 个维度。否则，无法执行池化。它也应该是35518(301x118(而不是33518。

每层之后的确切输出形状是什么？

似乎有两个 DNN 网络(一个用于第一个数据集，另一个用于另一个数据集(。这不是我完全确定的。但这是需要的，因为这两个数据集具有不同的输入大小。

(None, 301, 118) (None, 301, 58)
|                |
V                V
Flatten()         Flatten()
|                |
V                V
(None, 35518, 1) (None, 17458, 1)
|                |
V                V
Sumpooling()      Sumpooling()
|                |
V                V
(None, 500)       (None, 500)
|                |
V                V
Tanh             Tanh
|                |
V                V
(None, 500)      (None, 500)
|                |
V                V
Softmax(2)       Softmax(2)    
|                |
V                V
(None, 2)        (None, 2)

他们是否使用分类格式进行输出？

他们正在解决一个比拉里分类问题。所以是的，他们将使用分类格式。它会像，

If label 0 => [1 0]
If label 1 => [0 1]

它们也可以有一个带有一个 Sigmoid(1( 的最后一层，并具有标签(即标量 - 0/1(。

他们是否使用了 dropout 和任何其他层？

在这篇文章中并没有真正提到他们使用了辍学。老实说，似乎也没有合适的地方使用dropout。唯一的地方是在tanh之后。但由于网络并不那么复杂，作者可能觉得没有必要。

相关内容

最新更新

热门标签：