神经网络 - 当无法确定类标签时跳过一些序列元素?



我正在尝试使用LSTM神经网络对生物序列进行一些二进制预测。但是序列的某些元素由于某种原因无法分配给我的任何类标签。我的第一个想法是简单地跳过元素,但在使用旨在捕获长期依赖项的方法时,这似乎不是一个好方法。你有没有遇到过类似的问题?

更具体地说:

DEAQFKECYDTCHKECSDKGNGFTFCEMKCDTDCSVKDVKEKLENYKPKN

是一个示例序列

0000000000000000000000000000000000XXX11111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111

是序列的类标签。X 表示无法确定实际类标签。它可以出现在序列中的任何位置,而不仅仅是在具有不同标签的两个区域之间,如示例中所示。

我想我找到了解决方案:屏蔽 https://keras.io/layers/core/#masking

最新更新