小贝子编程

使用Xpath / Scrapy提取时删除空字段

我使用 Scrapy/Xpath 提取数据并生成字段 (typeFacture(

但它生成字段和另一个带有 (''(的空字段。

我想提取该文本并删除带有 (''( 的空字段以将其插入数据库。

网页代码：

<td class="tNorm tSmall-xs">
<b>FACTURE</b>
<br>
''
Commission
''
</td>

蟒蛇代码：

item['typeFacture']  = [item.strip() for item in sel.xpath('//tbody/tr/td[5]/text()').extract()]

结果：

'typeFacture': ['',
'',
'Commission',
'',
'',
'Commission',
'',
'',
'Commission',
'',
'',
'Commission',
'',
'',
'Abonnement']}

我找到了解决方案，但没有使用 XPATH。在将其插入数据库之前，我在简单的python代码中使用它

item['typeFacture'] = list(filter(None, item['typeFacture']))

最新更新