我正在编写小应用程序来比较两个XML文件,然后将差异输出到CSV。当我使用记事本++打开CSV时,一切看起来都很好(显示编码UTF-8,但是在使用MS Excel打开时我得到奇怪的字符。任何想法如何使其在MS Excel中工作?
我正在使用xml.etree.ElementTree
来解析 XML 文件。差异存储在两个列表中。我已经尝试了其他类似问题的各种建议,但似乎没有任何效果。
文件保存代码在这里:
def saveresults():
filesave = tkFileDialog.asksaveasfilename(initialdir=filenewdir, title="Save to CSV",
defaultextension=".csv", filetypes=[("CSV (Comma delimited)", ".csv")])
if filesave is not None:
with open(filesave, 'wb') as fp:
writef = unicodecsv.writer(fp, dialect="excel-tab", encoding="utf-8")
writef.writerow(("Trigger", "Variable", "Old label", "Old columns", "Old precode", "Old precode text",
"New label", "New columns", "New precode", "New precode text"))
for x, newvalue in enumerate(newvalues):
writef.writerow((newvalue[0], newvalue[1], oldvalues[x][2], oldvalues[x][3], oldvalues[x][4],
oldvalues[x][5], newvalue[2], newvalue[3], newvalue[4], newvalue[5]))
fp.close()
tkMessageBox.showinfo(title="Message", message="Done!")
记事本中经过测试的文本:
花费£2,000或更多用于建筑,装饰或家庭装修 Lietuvos valstiečių ir žaliųjų sąjungos (LVŽS)
使用 MS Excel 打开时的文本相同:
花费2,000英镑或更多用于建筑,装饰或家居装修 Lietuvos valstieÄių ir Å3/4aliųjų sÄ...Jungos (LVÅ1/2S)
Excel版本正在读取文件,就好像它是用ANSI编码的一样,所以我希望这最终是一个excel问题 - 你提到尝试其他问题的想法,这是否包括 是否可以强制Excel自动识别UTF-8 CSV文件? ?特别是,如果您打开 excel 然后导入数据,而不是从资源管理器/命令行使用 excel 打开数据,它是否有效?