如何使用python从网页内容中提取动态数字



举一个我想做的事情的例子,假设有一个网站每小时显示一次彩票结果。网页本身是静态的,周围的文本保持不变,只有数字在变化(人工输入,没有动态更新(。

类似于The lucky number is: X,其中X表示每小时不同的数字。

现在我想运行一个python脚本,它每小时解析一个数字,然后在一天结束时以一种漂亮的格式打印出所有数字。

我知道如何通过使用BeautifulSoup和请求库来获取网页内容,并且只获取其中的文本部分,而不使用html标记等,但我不太确定如何获取目标数字。

我在想一个类似regex的东西,它可以从文本中找到一个静态单词,例如"number is:",在这种情况下,然后在它后面抓住单词(数字(。

这可行吗?如果是,怎么做?

提前谢谢。

使用regex是可能的,但如果您已经知道字符串,并且它是静态的,请对该字符串使用简单的拆分。比方说var='幸运数字是:123'Out=int(var.split(':'([1](

出123

最新更新