如何对我漂亮的汤代码进行排序,以便它下载按字母顺序或特定字母反向抓取的内容



我正在尝试编写从 archive.org 上刮下视频游戏 ROMS 的代码,它目前从上到下下载所有文件,这些文件已经按字母顺序排列。我的计算机无法一次性下载所有文件,因此我想知道如何使其按反向字母顺序排序或能够告诉代码从特定字母开始。

这是代码:

from bs4 import BeautifulSoup as bs
import requests
DOMAIN = 'https://archive.org/'
URL = 'https://archive.org/download/nointroNintendoDSDecrypted_2020Mar08/'
FILETYPE = '%28USA%29.7z'
def get_soup(url):
return bs(requests.get(url).text, 'html.parser')
for link in get_soup(URL).find_all('a'):
file_link = link.get('href')
if FILETYPE in file_link:
print(file_link)
with open(link.text, 'wb') as file:
response = requests.get(URL + file_link)
file.write(response.content)

假设您有一个包含所有文件的数组 - 就像这个["a", "a", "a", "a", "b", "b", "c"],只是一个示例。

然后我们可以越过它们,从某个字母开始,就像这样。

def startAt(letter, array):
for a in ar:
if a.startswith(letter):
# Download

这将像这样工作,使用示例数组

startAt("a", ar) # Download 4 times
startAt("b", ar) # Download 2 times

希望这有帮助!

最新更新