Python网络抓取列表项



我们有一个内部网页的IP地址列表。IP地址以列表项的形式包含。我对Python还是有点陌生,希望能得到一些指导。我想以一个文本文件结束,用逗号分隔这些ip。

<li>192.168.1.1</li>

我正在使用一个公开的网站来回答我的问题,但是HTML源代码是相似的。

import requests
from bs4 import BeautifulSoup
URL = 'https://www.w3schools.com/html/tryit.asp?filename=tryhtml_lists_intro'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
list_items = soup.find_all('li')
print(list_items)
[<li>Coffee</li>, <li>Tea</li>, <li>Milk</li>, <li>Coffee</li>, <li>Tea</li>, <li>Milk</li>]

如何进一步将list_items的输出解析为列表/文本文件,例如:

咖啡、茶、牛奶、咖啡、茶、牛奶

谢谢!

您只需将整个标签添加到列表中,而不是将其文本内容添加到列表中。

list_items = ", ".join([li.text for li in soup.find_all("li")])
print(list_items)

相关内容

  • 没有找到相关文章

最新更新