如何在python中使用re.sub从文本中删除|sign



我正在处理文本文件,有人能告诉我如何使用re.sub删除|sign,然后只删除1和0.6271之类的numaric数据,而不是T123吗。我认为T123是阿尔法数字

page_data=1|0.6271|bacs|T123|生物活性物质

page_data =re.sub(r"|", '  ',page_data)

您必须转义|字符。

import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
re.sub(r"|", " ", page_data)

打印:

1 0.6271 bacs T123 Biologically Active Substance

编辑:

为了获得";数字";字符串中没有尝试这个:

import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
[i for i in re.sub(r"|", " ", page_data).split() if not i.isalpha()]

输出:

['1', '0.6271', 'T123']

最新更新