我有一个包含4个文本文件的文件夹。我想编写一个代码,用它我可以检查文件夹中文件的大小,只打开那些大小相等的文件。有人知道吗?
我已经试过这个了
import os
d=os.stat('H:/My Documents/211').st_size
我无法重现您的错误。这个
import os
print os.path.getsize('mydata.csv')
print os.stat('mydata.csv').st_size
产生
359415
359415
我猜你提供的文件名是错误的。这将打印文件夹中所有文件的大小
my_dir = r'path/to/subdir/'
for f in os.listdir(my_dir):
path = os.path.join(my_dir, f)
if os.path.isfile(path):
print os.path.getsize(path)
要获取目录中的所有文件,可以使用os.listdir
。
>>> import os
>>> basedir = 'tmp/example'
>>> names = os.listdir(basedir)
>>> names
['a', 'b', 'c']
然后,您需要将basedir
添加到名称中:
>>> paths = [os.path.join(basedir, name) for name in names]
>>> paths
['tmp/example/a', 'tmp/example/b', 'tmp/example/c']
然后,您可以使用os.stat(路径).strongize(我创建的示例文件为空)将其转换为(名称,大小)对的列表:
>>> sizes = [(path, os.stat(path).st_size) for path in paths]
>>> sizes
[('tmp/example/a', 0), ('tmp/example/b', 0), ('tmp/example/c', 0)]
然后,您可以使用collections.defaultdict
:将具有相同大小的路径分组在一起
>>> import collections
>>> grouped = collections.defaultdict(list)
>>> for path, size in sizes:
... grouped[size].append(path)
...
>>> grouped
defaultdict(<type 'list'>, {0: ['tmp/example/a', 'tmp/example/b', 'tmp/example/c']})
现在,您可以按大小获取所有文件,并将其全部打开(之后不要忘记关闭它们!):
>>> open_files = [open(path) for path in grouped[0]]