如何加载神经网络的训练数据



我在行动中看到的NeuralDataSet对象除了异或之外什么都没有,这只是两个小数据数组…我没能从MLDataSet的文档中找出任何东西。

似乎所有的东西都必须一次加载。但是,我想循环遍历训练数据,直到达到EOF,然后将其计数为1 epoch。然而,我所看到的所有数据都必须从一开始就加载到一个2D数组中。我怎么才能避开这个问题呢?

我已经读了这个问题,答案并没有真正帮助我。除此之外,我还没有在这里找到类似的问题。

这是可能的,您可以使用支持流操作的数据集的现有实现,或者您可以在您拥有的任何来源的基础上实现自己的数据集。以BasicMLDataSet接口和SQLNeuralDataSet代码为例。如果您有特定的格式,则必须实现编解码器。对于CSV,已经有了实现,我还没有检查它是否基于内存。

请记住,这样做时,您的数据将在每个epoch中完全流式传输,从我的经验来看,这是一个比网络实际计算高得多的瓶颈。

最新更新