在Google Colab中下载S3文件



我正在做一个项目,碰巧有些数据是以S3fileSystem的形式提供的。我可以使用S3FileSystem.open(路径(读取数据。但有360多个文件,读取一个文件至少需要3分钟。我想知道,有没有办法在我的系统中下载这些文件并从那里读取,而不是直接从S3fileSystem中读取。还有另一个原因,虽然我可以读取所有这些文件,但一旦我在colab上的会话重新连接,我就必须再次重新读取所有文件,因此这将花费大量时间。我正在使用以下代码读取文件

fs_s3 = s3fs.S3FileSystem(anon=True)
s3path = 'file_name'
remote_file_obj = fs_s3.open(s3path, mode='rb')
ds = xr.open_dataset(remote_file_obj, engine= 'h5netcdf')

有没有办法下载这些文件?

您可以使用另一个s3fs来装载bucket,然后将文件复制到Colab。

如何安装

安装后,您可以

!cp /s3/yourfile.zip /content/

最新更新