>我在如何选择包含 M 点的 mnist 训练集子集来训练 1-NN 分类器方面遇到麻烦,因为原始训练点的数量太大。
也就是说,我需要找出一个方案,该方案将一个标记的训练集和一个数字 M 作为输入,并返回大小为 M 的训练集的子集。
此外,不允许统一随机选择。((即随机选取训练点的M)
一种选择是使用数据生成器训练您的网络。它只加载一批数据一步一步。您将不再遇到数据问题。此外,它能够使用多线程。因此,数据的加载和预处理不是瓶颈。
这里有一个很好的例子:https://stanford.edu/~shervine/blog/keras-how-to-generate-data-on-the-fly
我希望这有所帮助。