我目前正在撰写Sturm等人(2016(发表在《神经科学杂志》(Journal of Neuroscience(上的一篇论文,试图使用python和TensorFlow,Keras库复制他们的结果。
我强烈怀疑我是否理解了他们设计模型的方式,如第2.1节所述。
由于我缺乏该领域的经验,我无法完全理解以下几点。
- 他们是否使用了 1D 或 2D 总和池层?
- 每层之后的确切输出形状是什么?
- 他们是否使用分类格式进行输出?
- 他们是否使用了 dropout 和任何其他层?
您将如何设计所描述的模型?
提前感谢您的宝贵意见。
这是我对此的看法。
使用的数据集:此处和本文中的数据集
他们是否使用了 1D 或 2D 总和池层?
虽然他们没有具体说明他们在模型中使用了什么,但它应该是 1D 池化。因为EEG信号只有两个维度(时间,通道(,这是1D池化层接受的输入类型。此外,该文件说(第2.1节(,
The first linear layer accepts an input of the dimensionality
301 time points × 118 channels EEG features
但是他们接着说了以下内容,这有点奇怪。
Each epoch’s spatio-temporal features(301 time points×118 channels for aa-ay,
301 time point×58 channels for subject od-obx) were vectorized
into one vector with 33518 (17458) dimensions.
我猜他们在此矢量化之后添加了单个维度,以便单个输入具有 2 个维度。否则,无法执行池化。它也应该是35518(301x118
(而不是33518。
每层之后的确切输出形状是什么?
似乎有两个 DNN 网络(一个用于第一个数据集,另一个用于另一个数据集(。这不是我完全确定的。但这是需要的,因为这两个数据集具有不同的输入大小。
(None, 301, 118) (None, 301, 58)
| |
V V
Flatten() Flatten()
| |
V V
(None, 35518, 1) (None, 17458, 1)
| |
V V
Sumpooling() Sumpooling()
| |
V V
(None, 500) (None, 500)
| |
V V
Tanh Tanh
| |
V V
(None, 500) (None, 500)
| |
V V
Softmax(2) Softmax(2)
| |
V V
(None, 2) (None, 2)
他们是否使用分类格式进行输出?
他们正在解决一个比拉里分类问题。所以是的,他们将使用分类格式。它会像,
If label 0 => [1 0]
If label 1 => [0 1]
它们也可以有一个带有一个 Sigmoid(1( 的最后一层,并具有标签(即标量 - 0/1(。
他们是否使用了 dropout 和任何其他层?
在这篇文章中并没有真正提到他们使用了辍学。老实说,似乎也没有合适的地方使用dropout。唯一的地方是在tanh
之后。但由于网络并不那么复杂,作者可能觉得没有必要。