我所在县的国家安全部有一个数据集,该数据集存在一些问题。
我根本无法从CSV文件中读取记录,只能调出空记录。当我将文件转换为XLSX时,它确实会被读取。
我想知道上述问题是否有任何可能的解决方案。
数据集位于:此处或此处。
我尝试了下面的代码,但除了第一列的第一行:之外,我只得到了null
df = pd.read_csv('mensal_ss.csv', sep=';', names=cols, encoding='latin1')
图像
谢谢!
如果您尝试使用utf-16
作为编码,它似乎可以工作。然而,请注意,年份行使解析变得复杂,因此您可能需要对csv进行一些额外的操作来规避这一点,这取决于您想对数据做什么
df = pd.read_csv('mensal_ss.csv', sep=';', encoding='utf-16')
尝试使用'utf-16-le':
import pandas as pd
df = pd.read_csv('mensal_ss.csv', sep=';', encoding='utf-16-le')
print(df.head())