我使用以下一行从beautifulsoup中提取一段javascript生成的HTML:
soup.find('span',{'class':'price-unit ng-binding'})
:
<span class="price-unit ng-binding" ng-class="{wanted: ad.wanted}">
<!-- ngIf: ad.price && ad.price !== '' --><span class="currency ng-binding ng-scope"
ng-if="ad.price && ad.price !== ''">
</span><!-- end ngIf: ad.price && ad.price !== '' -->2,350
<!-- ngIf: !ad.price || ad.price === '' -->
但是我想从上面提取值2350
是否可以使用findall进一步向下钻取,或者我需要手动剥离值?
您可以直接使用.text
和strip()
来获得您想要的输出。
>>> soup.find('span',{'class':'price-unit ng-binding'}).text.strip()
u'2,350'