我需要复制具有某些模式的文件。我需要使用 shutil 在给定目录上执行非递归复制。我尝试了下面给出的这段代码,执行递归复制。是否有任何选项可以指定在其中执行非递归复制。
from fnmatch import fnmatch, filter
from os.path import isdir, join
from shutil import copytree, ignore_patterns
src_directory = r'PATH'
dst_directory = r'PATH'
copytree(src_directory, ignored_directory,ignore=ignore_patterns('*.txt'))
确保目标目录首先存在。 然后创建一个要忽略的所有文件的列表glob.glob
.然后循环访问src
目录中的所有文件和目录,并将每个文件复制到dst
目录中(如果它是一个文件并且不在ignore
列表中(:
import os, shutil, glob
src = 'my_dir'
dst = 'my_dir_cp'
try:
os.mkdir(dst)
except FileExistsError:
pass
ignore = glob.glob(os.path.join(src, '*.txt'))
for file in os.listdir(src):
file = os.path.join(src, file)
if file not in ignore and os.path.isfile(file):
shutil.copy(file, dst)
一个完整的例子:
$ ls my_dir
bob cat.txt fish jim
$ python -q
>>> import os, shutil, glob
>>> src = 'my_dir'
>>> dst = 'my_dir_cp'
>>>
>>> try:
... os.mkdir(dst)
... except FileExistsError:
... pass
...
>>> ignore = glob.glob(os.path.join(src, '*.txt'))
>>> for file in os.listdir(src):
... file = os.path.join(src, file)
... if file not in ignore and os.path.isfile(file):
... shutil.copy(file, dst)
...
'my_dir_cp/jim'
'my_dir_cp/bob'
>>>
$ ls my_dir_cp
bob jim
如果您希望能够忽略多个glob
模式,则可以glob.glob
每个模式并将结果连接在一起(在列表理解中(:
import os, shutil, glob
src = 'my_dir'
dst = 'my_dir_cp'
try:
os.mkdir(dst)
except FileExistsError:
pass
patterns_to_ignore = ['*.txt', '*.bat']
ignore = [e for p in patterns_to_ignore for e in glob.glob(os.path.join(src, p))]
for file in os.listdir(src):
file = os.path.join(src, file)
if file not in ignore and os.path.isfile(file):
shutil.copy(file, dst)
这更像是一种黑客攻击,但会非递归地将目录中的所有文件复制到目标目录。您可以使用 glob 或正则表达式来忽略文件 -
import re
def copytree(src, dst):
for item in [f for f in os.listdir(src) if os.path.isfile(os.path.join(src, f)) if not re.match(f, '[.]txt$')]:
s = os.path.join(src, item)
d = os.path.join(dst, item)
shutil.copy2(s, d)
由于您选择使用shutil
中的copytree
,请注意,循环访问文件以复制每个文件的任何解决方案都会遗漏许多不错的copytree
功能,例如符号链接处理、复制文件元数据等。
您可以通过创建名为copyfiles
的非递归copytree
来保留所有额外内容。copyfiles
的工作方式与copytree
相同,只是它扩展了ignore
参数以在复制时也忽略文件夹。
import shutil, os
def copyfiles(src, dst, ignore=lambda a, b: set(), **kwargs):
return shutil.copytree(src, dst, ignore=lambda s, names: set(ignore(s, names)).union(set(filter(lambda name: os.path.isdir(os.path.join(s, name)), names))), **kwargs)
# use copyfiles like so:
copyfiles(src_directory, dst_directory, ignore=shutil.ignore_patterns('*.txt')) # copies non-recursively