将脚本结果输出为HTML和格式



我创建了一个小脚本,作为第一次使用python进行web抓取项目。它在两个不同的本地新闻网站上抓取每日预报(文本(和过敏预报(.jpg(。当然,打印到控制台并不理想,导入图像单独打开图像文件也不理想。理想情况下,我可以将文本和图像src插入HTML文件的主体中,也许还可以链接一个CSS文件,使其看起来更好。这可能吗?我很犹豫是否要为这样一个简单的脚本构建一个完整的网络应用程序,但如果这是理想的方法,我愿意接受。在这种情况下,我对任何可能被认为是最佳实践的方法持开放态度。下面列出的代码。

from bs4 import BeautifulSoup
import urllib.request
kxanUrl = 'https://www.kxan.com/weather/forecast/todays-forecast/'
kxanPage = requests.get(kxanUrl)
kvueUrl = 'https://www.kvue.com/allergy'
kvuePage = requests.get(kvueUrl)
soup = BeautifulSoup(kxanPage.content, 'html.parser')
weatherHtmlData = soup.find("div", {"class": "article-content rich-text"})
weatherText = weatherHtmlData.get_text()
allergyImage = urllib.request.urlretrieve("http://cdn.tegna-media.com/kvue/weather/allergy16x9.jpg", "allergy_forecast.jpg")

是的!这将是一个非常好的方法。以以下模板为例:

template = """<!DOCTYPE html>
<html>
<head>
<style>
body {background-color: powderblue;}
h1   {color: blue;}
p    {color: red;}
</style>
</head>
<body>
<h1>Forecast</h1>
<div>
$FORECAST_INFORMATION
</div>
<img src=$PATH_TO_ALLERGY_INFORMATION></img>
</body>
</html>""" 
# Pseudocode for writing a string to a file
write(string=template, file="~/results.html")

您可以使用刮取的数据.replace$FORECAST_INFORMATION,也可以对刮取的过敏图像的文件路径$PATH_TO_ALLERGY_INFORMATION执行同样的操作。

以上html摘自:https://www.w3schools.com/html/html_css.asp

最新更新