Python 正则表达式单词赏金



您好,我在下面有一个这样的文本字符串,我正在尝试使用正则表达式来提取总销售额,该数量可以在总销售额43之后的新行之后找到,例如43将是总销售额。我正在使用以下命令,但我想删除总销售额和,只保留数量。 我想知道我该怎么做,或者我需要做额外的处理。 谢谢

'ufeffSacramento Association of REALTORS®nSingle Family Home Sales by ZIP CODEnJanuary 2020nZip        
CodenCurrent MonthnLast MonthnLast YearnYear-to-DatenTotal Salesn43nREO  
Salesn0n45n40n43nMedian Sales Pricen$417,000n$0n$410,000n$400,000n$417,000nAverage    
Price/Square Footn$268nShort Salesn0n$253n$239nN/AnAverage Sq Ft of  
Propertyn1,769n$0n1,746n1,843nN/AnTotal Listing Inventory 
*n69nConventionaln43n65n90nN/AnTotal Listing Median Price 
∞n$612,475nSalesn$417,000n$574,900n$547,475nN/AnTotal Salesn29nREO 
**strong text**Salesn0n37n16n29nMedian Sales Pricen$369,000

我正在使用这样的命令:

total_sales = re.findall(r'bTotal Salesnd{2}',data)

返回:

['Total Salesn43',
'Total Salesn29',
'Total Salesn29',
'Total Salesn32',
'Total Salesn30',
'Total Salesn52',    

这将适用于您:

re.findall(r'bTotal Salesn(d*)',data)

使用正面的背后看:(?<=Total Salesn)d{2}.这样,它会检查Total Salesn字符串是否在模式d{2}之前。并且只捕捉到这一点。

最新更新