我正在使用colab笔记本下载这样的集:
_URL = "https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz"
zip_file = tf.keras.utils.get_file(origin=_URL, fname="flower_photos.tgz",extract=True)
base_dir = os.path.join(os.path.dirname(zip_file), 'flower_photos')
它显示数据集已下载到/root/.keras/datasets/flower_photos
但是文件夹 C:\Users\myUser.keras 为空。 去哪儿了?
数据集不会下载到您的计算机,而是下载到您在 Google Colab 中创建新的 .ipynb 文件时创建的虚拟机。使用 Colab 笔记本中的以下命令检查虚拟机的属性:
# Explore your VM
!ls -la /
# Find disk space and RAM space
!df -h
!free -m
#What OS is your VM using:
!cat /etc/os-release
并且,检查 VM 中拥有的所有数据集:
!ls /root/.keras/datasets/
《走向数据科学》的一篇文章提到:
Google Colab有一个大问题,之前经常讨论,那就是数据的存储。笔记本(例如 Jupyter 笔记本(通常使用存储在本地计算机上的数据文件。这通常使用简单的read_csv语句或可比较的语句来完成。但谷歌联合实验室正在云中运行。云的本地不是您的本地。因此,read_csv语句将在Google方面而不是您方面搜索文件。然后它就找不到它了。
也就是说:下载的数据暂时存储在云的本地。如果您的colab笔记本断开连接,请确保此类数据永远丢失。
如何解决此问题(丢失下载的数据(:使用Google云端硬盘以及Google Colab笔记本。有关它的更多信息,请阅读上述文章。