如何用python处理HTML中的ngIf字段?



我使用以下一行从beautifulsoup中提取一段javascript生成的HTML:

soup.find('span',{'class':'price-unit ng-binding'})  

:

<span class="price-unit ng-binding" ng-class="{wanted: ad.wanted}">
<!-- ngIf: ad.price && ad.price !== '' --><span class="currency ng-binding ng-scope" 
ng-if="ad.price &amp;&amp; ad.price !== ''">
</span><!-- end ngIf: ad.price && ad.price !== '' -->2,350
        <!-- ngIf: !ad.price || ad.price === '' -->

但是我想从上面提取值2350

是否可以使用findall进一步向下钻取,或者我需要手动剥离值?

您可以直接使用.textstrip()来获得您想要的输出。

>>> soup.find('span',{'class':'price-unit ng-binding'}).text.strip()
u'2,350'

最新更新