TF 求和池层 1D 与 2D



我目前正在撰写Sturm等人(2016(发表在《神经科学杂志》(Journal of Neuroscience(上的一篇论文,试图使用python和TensorFlow,Keras库复制他们的结果。

我强烈怀疑我是否理解了他们设计模型的方式,如第2.1节所述。

由于我缺乏该领域的经验,我无法完全理解以下几点。

  1. 他们是否使用了 1D 或 2D 总和池层?
  2. 每层之后的确切输出形状是什么?
  3. 他们是否使用分类格式进行输出?
  4. 他们是否使用了 dropout 和任何其他层?

您将如何设计所描述的模型?

提前感谢您的宝贵意见。

这是我对此的看法。

使用的数据集:此处和本文中的数据集

他们是否使用了 1D 或 2D 总和池层?

虽然他们没有具体说明他们在模型中使用了什么,但它应该是 1D 池化。因为EEG信号只有两个维度(时间,通道(,这是1D池化层接受的输入类型。此外,该文件说(第2.1节(,

The  first  linear  layer  accepts  an input  of  the  dimensionality  
301  time  points × 118  channels EEG features

但是他们接着说了以下内容,这有点奇怪。

Each epoch’s spatio-temporal features(301  time  points×118  channels  for  aa-ay,  
301  time  point×58  channels  for  subject  od-obx)  were  vectorized  
into  one vector with 33518 (17458) dimensions.

我猜他们在此矢量化之后添加了单个维度,以便单个输入具有 2 个维度。否则,无法执行池化。它也应该是35518(301x118(而不是33518。

每层之后的确切输出形状是什么?

似乎有两个 DNN 网络(一个用于第一个数据集,另一个用于另一个数据集(。这不是我完全确定的。但这是需要的,因为这两个数据集具有不同的输入大小。

(None, 301, 118) (None, 301, 58)
|                |
V                V
Flatten()         Flatten()
|                |
V                V
(None, 35518, 1) (None, 17458, 1)
|                |
V                V
Sumpooling()      Sumpooling()
|                |
V                V
(None, 500)       (None, 500)
|                |
V                V
Tanh             Tanh
|                |
V                V
(None, 500)      (None, 500)
|                |
V                V
Softmax(2)       Softmax(2)    
|                |
V                V
(None, 2)        (None, 2)    

他们是否使用分类格式进行输出?

他们正在解决一个比拉里分类问题。所以是的,他们将使用分类格式。它会像,

If label 0 => [1 0]
If label 1 => [0 1]

它们也可以有一个带有一个 Sigmoid(1( 的最后一层,并具有标签(即标量 - 0/1(。

他们是否使用了 dropout 和任何其他层?

在这篇文章中并没有真正提到他们使用了辍学。老实说,似乎也没有合适的地方使用dropout。唯一的地方是在tanh之后。但由于网络并不那么复杂,作者可能觉得没有必要。

最新更新