深度学习应用程序的已知数据丢失期



我正在使用手术的时间序列数据来标记患者(二进制(是否患有某种疾病,因为患者已出院。我希望使用LSTM或RNN。然而,当患者进行搭桥手术时,序列中缺少某些特征(例如,由于心脏停止跳动而没有脉搏(。因此,我的所有患者在某个时刻都有"缺失数据"。我应该仍然使用插补吗?还是有一种方法可以使用这些已知差距的特征?

取决于您的应用程序。

处理它的一种方法是从训练集中删除任何具有缺失特征的样本。当然,在测试时,预测是不可靠的,因为这是一种看不见的情况。因此,您的任务是在测试时检测这些情况,并告诉用户预测不可靠。

另一种选择:如果可能缺失的特征是分类的;未知";类别可能只是很好的训练。对于不起作用的数字功能。

最新更新