通过http遍历目录

假设我有一个url http://example.com/result，它将打开一个页面，有一些(目录的数量可以是1,2,3…任意数量的目录)目录。我想遍历每个目录并找到new.txt文件，它可以在目录或子目录....

中的任何位置

http://example.com/result有以下目录:

security
major
minor
fails
logs
..

我需要在每个目录中找到new.txt，并想要读取内容。所有目录(security/major/…等)也可能有子目录。我需要在目录或子目录中找到new.txt

如果你想用python做，那么你必须使用urllib。

检查每个页面的标题。对于目录和文件，将有链接标签。转到该链接标签并检查标题。文件和目录的头可能不同。

如果是目录，则递归调用相同的函数并检查该目录中的每个文件

相关内容