获取zip文件中的顶级目录



在压缩文件"test.zip"中有以下结构

  • JOU=00335/VOL=2019.30/ISU=9-10/ART=9812/data.xml
  • JOU=00335/VOL=2019.30/ISU=9-10/ART=9813/data.xml
  • JOU=00335/VOL=2019.30/ISU=9-10/ART=9814/data.xml

有多个顶级文件夹,如JOU=00336JOU=00337等。

我想数一下顶级文件夹。

我有下面的代码,它给了我在test.zip中压缩的所有XML文件的计数。

with ZipFile("test.zip", "r") as f:
print(len(f.namelist()))

不确定如何只计算顶级文件夹

您可以分割路径以获得其中的第一个元素,并使用set:计算那些唯一的元素

top = {item.split('/')[0] for item in f.namelist()}
print(len(top))

最新更新