pykml 和 utf8:要么输入不正确,要么我听不懂



我有一个来自www的kmz文件,并希望将其读取为csv或使用pykml。该文件是UTF8格式的,或者至少它声称是这样的——参见下面的标题。读取它可以工作,但是当读取到第一个重音字符时会触发错误。

<?xml version='1.0' encoding='UTF-8'?>
<kml xmlns='http://www.opengis.net/kml/2.2'>
 <Document>
   <name>
from pykml import parser
with open(KMZFIL) as f:
 folder=parser.parse(f).getroot().Document.Folder
for pm in folder.Placemark:
 print(pm.name)
Ablitas (militar) (Emerg)
Ademuz (forestal)
Ager (PL%)
Alcala del Rio (ILIPA MAGNA)(Esc.)
Traceback (most recent call last):
  File "bin4/b21_xxxxxxx", line 15, in <module>
    print(pm.name)
grep "name" $INFIL | head -7
 ( ... )
   <name>Ablitas (militar) (Emerg)</name>
   <name>Ademuz (forestal)</name>
   <name>Ager (PL%)</name>
   <name>Alcala del Rio (ILIPA MAGNA)(Esc.)</name>
   <name>Ainzón</name>

您需要以一种指示Python将字节解释为UTF-8字符的方式打开文件。在Python 2.7中,您可以使用codecs模块。

import codecs
with codecs.open(KMZFIL, encoding='utf-8') as f:

在Python 3中,encoding选项已添加到标准的open中,因此不需要使用codecs

没有看到这里的答案,但这些是lmxl StringElements -我使用。text来修复这个错误。

将print(pm.name)改为print(pm.name.text)

https://lxml.de/api/lxml.objectify.StringElement-class.html

最新更新