举一个我想做的事情的例子,假设有一个网站每小时显示一次彩票结果。网页本身是静态的,周围的文本保持不变,只有数字在变化(人工输入,没有动态更新(。
类似于The lucky number is: X
,其中X表示每小时不同的数字。
现在我想运行一个python脚本,它每小时解析一个数字,然后在一天结束时以一种漂亮的格式打印出所有数字。
我知道如何通过使用BeautifulSoup和请求库来获取网页内容,并且只获取其中的文本部分,而不使用html标记等,但我不太确定如何获取目标数字。
我在想一个类似regex的东西,它可以从文本中找到一个静态单词,例如"number is:",在这种情况下,然后在它后面抓住单词(数字(。
这可行吗?如果是,怎么做?
提前谢谢。
使用regex是可能的,但如果您已经知道字符串,并且它是静态的,请对该字符串使用简单的拆分。比方说var='幸运数字是:123'Out=int(var.split(':'([1](
出123