我创建了一个脚本来合并几个.csv文件,使用pandas python库。所有文件都使用"\r"作为记录分隔符。 我遇到了一个文件的问题,在特定字段中,有时会出现""。这会导致pandas.read_csv
将其计为新行。
是否有机会(除了字段分隔符)指定记录分隔符?或者会有更好的解决方案吗?
谢谢你和最诚挚的问候
浏览pandas.read_csv
中的所有夸格
有lineterminator
kwarg:
lineterminator : str (length 1), default None
Character to break file into lines. Only valid with C parser.
请注意,它需要使用 C 解析器(参见engine
kwarg)
鉴于您的行以r
结尾,这是回车符,我建议使用它作为lineterminator
并进行后期处理以清理n
留下的。
我认为设置lineterminator='r'
应该可以解决您的问题。