我最近一直在使用 python 报纸库,我正在尝试创建一个系统,该系统可以搜索 BBC 新闻网站上的所有文章,并将每个标题插入位于我 PC 上的 WAMP 服务器的 MySQL 数据库中。我的问题是以下代码同时返回实际的文章标题和 null 值,我显然不希望在我的数据库中使用。有什么方法可以阻止这种情况发生吗?
谢谢:)
import newspaper
import mysql.connector
mydb = mysql.connector.connect(
host="localhost",
user="root",
passwd="",
database="headlines"
)
mycursor = mydb.cursor()
sql = "insert into headlines (headline) values (%s)"
search = newspaper.build('https://www.bbc.co.uk/news')
for article in search.articles:
mycursor.execute(sql, (article.title,))
mydb.commit()
我假设数据库中的空条目是通过将 Python 上传到 MySQL 服务器的None
条目出现的。如果是这种情况,您可以简单地检查文章是否None
,然后跳过它上传到数据库。
for article in search.articles:
if article is None:
continue
mycursor.execute(sql, (article.title,))
mydb.commit()