Python 3:如何解析文本字段可以包含嵌入换行符的 csv 文件



当导出Excel/libreoffice工作表时,其中单元格可以包含新行作为CSV,生成的文件将这些新行保留为文字换行符,而不是类似于字符字符串""的东西。

Python 3 中的标准 csv 模块显然没有在必要时处理这个问题。文档说"注意 读取器被硬编码为将'\r'或''识别为行尾,并忽略行终止符。这种行为将来可能会改变。嗯,嘟嘟。

有没有其他方法可以正确读取此类csv文件?csv 真正应该做的是忽略任何带有引号文本字段的新行,只识别字段外的新行字符,但由于它没有,有没有不同的方法来解决实现我自己的 CSV 解析器?

尝试将熊猫与 df = pandas.read_csv('my_data.csv') 一起使用。您可以更精细地控制数据的读取方式。如果您担心格式问题,您还可以将 csv 的分隔符从 libreoffice 设置为自然界中不会出现的内容,例如;;

最新更新