我有一个地址列表,例如16388 28TH AVENUE。出于某种原因,地理编码器更喜欢处理没有 -th 的地址。如何删除它们,请记住,可能存在包含th组合的街道,因此只有当-th出现在数字之后时?
第一部分(?<=d)
检查前面是否有数字,最后一部分(?=s)
检查后面是否有空格。
>>> import re
>>> re.sub(r"(?<=d)(ST|ND|RD|TH)(?=s)", "","16388 28TH AVENUE")
'16388 28 AVENUE'
为其余可能的数字添加了(ST|ND|RD|TH)