Python 3 剥离复杂的字符串



我的python字符串看起来像这样:

a = 'nnSITE TYPE:xa0VOLUNTARY CLEANUPxa0xa0nNATIONAL PRIORITIES LIST:xa0NOxa0xa0nACRES:xa048 ACRESxa0xa0nAPN:xa011518019xa0xa0nnnnCLEANUP OVERSIGHT AGENCIES:nDEL NORTE COUNTYDTSC - SITE CLEANUP PROGRAM -  LEAD AGENCYUS EPAnnnnn'
无法使用简单的条带,如果我

做 a.strip(''(,只有条带的左侧被删除,如果我剥离或 rstrip 它不会删除,此外还有没有其他方法可以删除 unicode 字符和换行符?

使用 str.replace 替换所有换行符"n"。并使用带有'latin1'str.decode作为编码来解码字符串。

前任:

a = 'nnSITE TYPE:xa0VOLUNTARY CLEANUPxa0xa0nNATIONAL PRIORITIES LIST:xa0NOxa0xa0nACRES:xa048 ACRESxa0xa0nAPN:xa011518019xa0xa0nnnnCLEANUP OVERSIGHT AGENCIES:nDEL NORTE COUNTYDTSC - SITE CLEANUP PROGRAM -  LEAD AGENCYUS EPAnnnnn'
a = a.replace("n", "")
print(a.decode('latin1'))

输出:

SITE TYPE: VOLUNTARY CLEANUP  NATIONAL PRIORITIES LIST: NO  ACRES: 48 ACRES  APN: 11518019  CLEANUP OVERSIGHT AGENCIES:DEL NORTE COUNTYDTSC - SITE CLEANUP PROGRAM -  LEAD AGENCYUS EPA

注意:在python2.7中测试

最新更新