使用python和bs4从htmldiv标记中提取文本


<div class="available-date-component">Available 4/1 at 9:00 AM</div>

我正在尝试使用下面的代码从上面的htmldiv中提取文本

date = page.find('div', {'class' : 'available-date-component'}) 
print(date.string) # this line needs to be fixed

有人建议我如何只打印"上午9点4/1可用"而不是整个div吗?

def clean(raw_html):
cleaner = re.compile('<.*?>')
cleantext = re.sub(cleaner, '', raw_html)
return cleantext

最后,我通过这个函数传递了htmldiv,该函数删除了所有标记并留下了我想要的文本。

最新更新