我正在处理文本文件,有人能告诉我如何使用re.sub删除|sign,然后只删除1和0.6271之类的numaric数据,而不是T123吗。我认为T123是阿尔法数字
page_data=1|0.6271|bacs|T123|生物活性物质
page_data =re.sub(r"|", ' ',page_data)
您必须转义|
字符。
import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
re.sub(r"|", " ", page_data)
打印:
1 0.6271 bacs T123 Biologically Active Substance
编辑:
为了获得";数字";字符串中没有尝试这个:
import re
page_data = '1|0.6271|bacs|T123|Biologically Active Substance'
[i for i in re.sub(r"|", " ", page_data).split() if not i.isalpha()]
输出:
['1', '0.6271', 'T123']