浏览目录,查找.xls文件和 glob 会忽略它们(Python 和 glob 模块)



我写了一个 for 循环,它遍历目录树并成功返回所有文件名。 子文件夹包含.pdf文件,因此我尝试仅从.xls文件中提取数据。 由于某种原因,使用 glob('*.xls'( 不起作用。

它们不是.xlsx扩展,而是.xls所以这不是问题。 我已经运行了打印函数来测试目录遍历(它有效(,但后来我似乎无法获取扩展名为 .xls 的文件。

import os
from glob import glob
for folderName, subfolders, filenames in os.walk('C:\Users\userName\someFiles'):
    print('The current folder is ' + folderName)
    for subfolder in subfolders:
        print('SUBFOLDER OF ' + folderName + ': ' + subfolder)
    for filename in filenames:
        dataPrint = glob('*.xls')
        print('File Name is: '+filename+ ' Glob name is: '+str(dataPrint))

这适用于以下程度:

The current folder is C:Users\userName\someFilessubFolder
File Name is: Sample Data March 2019.pdf Glob name is: []
File Name is: File 1 March 2019.pdf Glob name is: []
File Name is: File 1 March 2019.xls Glob name is: []

你可以看到 glob 是如何出现空白的。 我想不通,因为glob以前从未让我失望过!感谢您的观看。

这可能对你有用

import os
from glob import glob
path = 'C:\Users\username\Desktop\glob\target'
for folderName, subfolders, filenames in os.walk(path):
    for subfolder in subfolders:
        print('SUBFOLDER OF ' + folderName + ': ' + subfolder)
    for filename in filenames:
        dataPrint = glob(path+'\*.xlsx')
        print('File Name is: '+filename+ ' Glob name is: '+str(dataPrint))

最新更新