我有一个来自www的kmz文件,并希望将其读取为csv或使用pykml。该文件是UTF8格式的,或者至少它声称是这样的——参见下面的标题。读取它可以工作,但是当读取到第一个重音字符时会触发错误。
<?xml version='1.0' encoding='UTF-8'?>
<kml xmlns='http://www.opengis.net/kml/2.2'>
<Document>
<name>
from pykml import parser
with open(KMZFIL) as f:
folder=parser.parse(f).getroot().Document.Folder
for pm in folder.Placemark:
print(pm.name)
Ablitas (militar) (Emerg)
Ademuz (forestal)
Ager (PL%)
Alcala del Rio (ILIPA MAGNA)(Esc.)
Traceback (most recent call last):
File "bin4/b21_xxxxxxx", line 15, in <module>
print(pm.name)
grep "name" $INFIL | head -7
( ... )
<name>Ablitas (militar) (Emerg)</name>
<name>Ademuz (forestal)</name>
<name>Ager (PL%)</name>
<name>Alcala del Rio (ILIPA MAGNA)(Esc.)</name>
<name>Ainzón</name>
您需要以一种指示Python将字节解释为UTF-8字符的方式打开文件。在Python 2.7中,您可以使用codecs
模块。
import codecs
with codecs.open(KMZFIL, encoding='utf-8') as f:
在Python 3中,encoding
选项已添加到标准的open
中,因此不需要使用codecs
。
没有看到这里的答案,但这些是lmxl StringElements -我使用。text来修复这个错误。
将print(pm.name)改为print(pm.name.text)
https://lxml.de/api/lxml.objectify.StringElement-class.html