我正在尝试抓取这个网站的一些信息:https://cryptoslam.io/nba-top-shot/sales正如您所看到的,在第一列'Sold'中,我获得了该行的时间和日期的一些信息。问题是这一栏的信息是用文字显示的比如" 2分钟前" " x秒前"或者"六个月前">
我想创建一个数据框架,其中列'Sold'显示确切的时间和日期。而不是"一分钟前"我想要得到"11/3-2021,17:17h";或者类似的东西。这可能吗?
提前感谢。
BeautifulSoup自己不会为你做这些。它负责将页面上的内容从页面中拉出来。它不处理任何类型的数据转换。因此,您需要一个模块来解析这些字符串并将其转换为日期/时间值。
我找到了可以帮你做这件事的模块。你可以这样安装:
pip install dateparse
那么使用起来就超级简单了:
import dateparser
import datetime
# Display current time
now = datetime.datetime.now()
print(now)
# Display result of parsing a human-readable relative time
# to go back two hours
date = dateparser.parse('2 hours ago')
print(date)
结果:
2021-03-11 09:05:05.884789
2021-03-11 07:05:05.942474