从头开始加载MNIST数据集,并在训练验证测试集中对其进行拆分



有很多关于加载和拆分MNIST数据集的指南,比如这本。他们正在使用Keras或Tensorflow等库。

我想从零开始加载MNIST数据集并在trainig验证测试集中进行拆分,该测试集仅使用内置的python功能(如果需要,还可以使用numpy库(。

这是到数据集的链接:MNIST数据集。

  • 你能帮我吗

您可以查看Tensorflow或Keras的源代码,看看他们是如何在没有其他库的情况下下载它的。以下是PyTorch中的相关代码。它使用这个帮助程序代码。据我所知,代码只使用标准库。您可以重用他们的代码(BSD-3条款许可证(,或者阅读他们的代码,看看您必须做什么,然后编写自己的代码。

一旦数据在您的磁盘上并且您可以加载它,就有几个选项可以创建自定义的训练/验证/测试拆分:Python将数据拆分为随机集

最新更新