假设我有一个url http://example.com/result,它将打开一个页面,有一些(目录的数量可以是1,2,3…任意数量的目录)目录。我想遍历每个目录并找到new.txt文件,它可以在目录或子目录....
中的任何位置http://example.com/result有以下目录:
security
major
minor
fails
logs
..
我需要在每个目录中找到new.txt,并想要读取内容。所有目录(security/major/…等)也可能有子目录。我需要在目录或子目录中找到new.txt
如果你想用python做,那么你必须使用urllib。
检查每个页面的标题。对于目录和文件,将有链接标签。转到该链接标签并检查标题。文件和目录的头可能不同。
如果是目录,则递归调用相同的函数并检查该目录中的每个文件