当尝试在cmd中读取时,En dash/Em破折号txt文件格式



我试图操作一个使用连字符的txt文件,但cmd将其读取为–。Em破折号的格式也不完整,显示为—有趣的是,如果我在脚本(.py文件(中同时使用这两个符号,并将其与print命令关联,那么所有符号都会正确显示。在翻译方面也完全没有问题。在导入文件之前,有什么方法可以让它识别这些字符吗?非常感谢。

我不再需要帮助,因为我已经能够自己解决问题了,但我会把它放在这里,因为它将来可能会帮助其他人。

问题是py以ANSI打开文件,而由于特殊字符,文件必须以UTF-8打开。因此,在调用open函数时添加encoding='utf-8'解决了问题。

最新更新