如何使用python检查目录中文件的大小



我有一个包含4个文本文件的文件夹。我想编写一个代码,用它我可以检查文件夹中文件的大小,只打开那些大小相等的文件。有人知道吗?

我已经试过这个了

import os

d=os.stat('H:/My Documents/211').st_size

我无法重现您的错误。这个

import os
print os.path.getsize('mydata.csv')
print os.stat('mydata.csv').st_size

产生

359415
359415

我猜你提供的文件名是错误的。这将打印文件夹中所有文件的大小

my_dir = r'path/to/subdir/'
for f in os.listdir(my_dir):
    path = os.path.join(my_dir, f)
    if os.path.isfile(path):
        print os.path.getsize(path)

要获取目录中的所有文件,可以使用os.listdir

>>> import os
>>> basedir = 'tmp/example'
>>> names = os.listdir(basedir)
>>> names
['a', 'b', 'c']

然后,您需要将basedir添加到名称中:

>>> paths = [os.path.join(basedir, name) for name in names]
>>> paths
['tmp/example/a', 'tmp/example/b', 'tmp/example/c']

然后,您可以使用os.stat(路径).strongize(我创建的示例文件为空)将其转换为(名称,大小)对的列表:

>>> sizes = [(path, os.stat(path).st_size) for path in paths]
>>> sizes
[('tmp/example/a', 0), ('tmp/example/b', 0), ('tmp/example/c', 0)]

然后,您可以使用collections.defaultdict:将具有相同大小的路径分组在一起

>>> import collections
>>> grouped = collections.defaultdict(list)
>>> for path, size in sizes:
...     grouped[size].append(path)
... 
>>> grouped
defaultdict(<type 'list'>, {0: ['tmp/example/a', 'tmp/example/b', 'tmp/example/c']})

现在,您可以按大小获取所有文件,并将其全部打开(之后不要忘记关闭它们!):

>>> open_files = [open(path) for path in grouped[0]]

相关内容

  • 没有找到相关文章

最新更新