我有一个这样的csv文件
输入图片描述
包含重复的名称。关键是我只对速度和地位感兴趣。
所以我定义了以下内容:
used_columns=['time.2','speed','time.4','status']
df =pd.read_csv(path,usecols=used_columns)
棘手的部分是,如果其中一列缺失,那么它将无法找到其中一列(我有很多csv文件,它们可能不同)
一个选项是读取整个csv并保存列名并将其带到'speed', 'status'
之前,但我试图避免读取整个csv,因为它是一个巨大的文件,我有很多csv文件。
我认为您可以在读取.csv
文件时使用nrows=
参数。这样,您可以只读取几行(而不是整个文件),保存列名并只读取文件中存在的列:
df = pd.read_csv(path, nrows=2)
# columns are in df.columns:
print(df.columns)