我正在使用谷歌协作训练卷积神经网络。我的数据(图像(存储在谷歌硬盘中,我可以正确使用它。然而,有时读取图像的过程太慢,不起作用(其他时候过程更快,我读取图像没有问题(。为了从谷歌驱动器读取图像,我使用:
from google.colab import drive
drive.mount('/content/drive')
!unzip -u "/content/drive/My Drive/the folder/files.zip"
IMAGE_PATH = '/content/drive/My Drive/the folder'
file_paths = glob.glob(path.join(IMAGE_PATH, '*.png'))
有时有效,有时无效或速度太慢:(。
无论哪种方式,我都想在不使用谷歌驱动器的情况下从桌面上的文件夹中读取数据,但我无法做到这一点。
我正在尝试以下操作:
IMAGE_PATH = 'C:/Users/path/to/my/folder'
file_paths = glob.glob(path.join(IMAGE_PATH, '*.png'))
但是我收到一个错误,说目录/文件不存在。
Google Colab
无法直接访问我们的本地机器数据集,因为它运行在云上的单独虚拟机上。我们需要将数据集上传到Google Drive
中,然后才能将其加载到Google Colab’s
运行时中进行模型构建。
为此,您需要遵循以下步骤:
-
创建大型数据集的zip文件,然后将该文件上传到
Google Drive
中。 -
现在,使用相同的google id打开
Google Colab
,使用以下代码装载Google Drive
,并授权访问驱动器:
来自谷歌实验室导入驱动器
drive.mount('/content/drive'(
您上传的zip文件将在左窗格中安装在Google Colab
的驱动器/drive/MyDrive/
中可用。
- 要将数据集读取到
Google Colab
中,您需要解压缩文件夹并使用以下代码将其内容提取到/tmp
文件夹中
导入zipfile
导入os
zip_ref=zipfile。ZipFile('/content/drive/MyDrive/train.zip','r'(#以读取模式打开zip文件zip_ref.extractell('/tmp'(#将文件提取到/tmp文件夹
zip_ref.close((
您可以在左侧窗格的/drive/train
文件夹中检查提取的文件。
- 现在终于需要加入数据集的路径,以便在
Google Colab's
运行时环境中使用它
train_dataset=os.path.join('/tmp/train/'(#数据集