所以,我试图在Python中导入以下类型的一些文本数据:
和
GW - Complex Work
GW - Complex Work
GW - Complex Work
GW - Complex Work
但是我得到的文本是
和
GW - Complex Work
GW - Complex Work
GW - Complex Work
尝试用空格-替换符号无效。有什么建议吗,怎么去掉这个符号?或者更好的是,如何导入数据而不会将长连字符变为符号?
这个问题很可能是由于编码不当造成的。尝试使用下面的代码片段来读取使用utf8编码的文件,或者使用可以替代您选择的编码。
with open(filename, 'r', encoding='utf8') as f:
text = f.read()