如何将多个网址的内容打印到一个txt.file上?



下午好,我是堆栈溢出的新手,所以如果我的问题格式不正确,我提前道歉。

我有一个这样的 URL 列表(但更多(,

master_urls = 
['https://www.sec.gov/Archives/edgar/daily-index/2020/QTR1/master.20190102.idx',
'https://www.sec.gov/Archives/edgar/daily-index/2020/QTR1/master.20190103.idx] 

我想将内容写入一个 txt.file。 使用这些 URL 之一工作得很好。我执行以下步骤来实现它:

file_url = r"https://www.sec.gov/Archives/edgar/daily-index/2019/QTR2/master.20190401.idx"
content = requests.get(file_url).content
with open('master_20190401.txt', 'wb') as f:
f.write(content)

txt.file 看起来像这样(这只是文本文件的一小部分示例,但它都与下面显示的相同,只是公司名称不同......等(:

CIK|Company Name|Form Type|Date Filed|File Name
--------------------------------------------------------------------------------
1000045|NICHOLAS FINANCIAL INC|8-K|20190401|edgar/data/1000045/0001193125-19-093800.txt
1000209|MEDALLION FINANCIAL CORP|SC 13D/A|20190401|edgar/data/1000209/0001193125-19-094732.txt
1000228|HENRY SCHEIN INC|4|20190401|edgar/data/1000228/0001209191-19-021970.txt
1000275|ROYAL BANK OF CANADA|424B2|20190401|edgar/data/1000275/0001140361-19-006199.txt

我尝试了以下代码将所有URL的内容放到一个文本文件中

for file in master_urls:
content = requests.get(file).content
with open('complete_list.txt', 'w') as f:
f.write(content)

但它不起作用。

谁能帮我把 URL 列表中每个 URL 的内容放到一个文本文件中?

提前谢谢你。

由于您在循环中为每个 URL 打开文件,因此文件变得过度。

试试这个:

with open('complete_list.txt', 'wb') as f:
for url in master_urls:
content = requests.get(url).content
f.write(content)

相关内容

最新更新