Google Cloud Storage :Python API 使用通配符获取 blob 信息



我正在尝试从存储桶中获取 blob 信息,但我想在 blob 名称中使用通配符。考虑我的存储桶

$ gsutil ls gs://myBucket/myPath/
gs://myBucket/myPath/
gs://myBucket/myPath/ranOn=2018-12-11/
gs://myBucket/myPath/ranOn=2018-12-12/
gs://myBucket/myPath/ranOn=2018-12-13/
gs://myBucket/myPath/ranOn=2018-12-14/
gs://myBucket/myPath/ranOn=2018-12-15/
gs://myBucket/myPath/ranOn=2019-02-18/
gs://myBucket/myPath/ranOn=2019-02-19/
gs://myBucket/myPath/ranOn=2019-02-20/
gs://myBucket/myPath/ranOn=2019-02-21/

现在从命令行,我能够做到

$ gsutil ls gs://myBucket/myPath/ranOn=2018*
gs://myBucket/myPath/
gs://myBucket/myPath/ranOn=2018-12-11/
gs://myBucket/myPath/ranOn=2018-12-12/
gs://myBucket/myPath/ranOn=2018-12-13/
gs://myBucket/myPath/ranOn=2018-12-14/
gs://myBucket/myPath/ranOn=2018-12-15/

因此我可以对尺寸做同样的事情

$ gsutil du -sh gs://myBucket/myPath/ranOn=2018*
2.7 G

现在,我想用Python API做同样的事情。这是我尝试过的

from google.cloud import storage
storage_client = storage.Client()
bucket = storage_client.get_bucket('myBucket')
blob = bucket.get_blob('myPath/ranOn=2018*')
print('Size: {} bytes'.format(blob.size))
Size: None bytes

为什么这不起作用?如何在 python API 的 blob 路径中使用通配符?

不幸的是,get_blob仅用于获取单个文件,而不是多个文件。

您需要循环访问与前缀匹配的所有文件,并对其大小求和以获得总大小。

blobs = bucket.list_blobs(prefix="myPath/ranOn=2018")
total = sum([blob.size for blob in blobs])

最新更新