使用Xpath / Scrapy提取时删除空字段



我使用 Scrapy/Xpath 提取数据并生成字段 (typeFacture(

但它生成字段和另一个带有 (''(的空字段。

我想提取该文本并删除带有 (''( 的空字段以将其插入数据库。

网页代码:

<td class="tNorm tSmall-xs">
<b>FACTURE</b>
<br>
''
Commission
''
</td>

蟒蛇代码:

item['typeFacture']  = [item.strip() for item in sel.xpath('//tbody/tr/td[5]/text()').extract()]

结果:

'typeFacture': ['',
'',
'Commission',
'',
'',
'Commission',
'',
'',
'Commission',
'',
'',
'Commission',
'',
'',
'Abonnement']}

我找到了解决方案,但没有使用 XPATH。 在将其插入数据库之前,我在简单的python代码中使用它

item['typeFacture'] = list(filter(None, item['typeFacture']))

最新更新