获取某些列名的前一列

我有一个这样的csv文件

输入图片描述

包含重复的名称。关键是我只对速度和地位感兴趣。

所以我定义了以下内容:

used_columns=['time.2','speed','time.4','status']
df =pd.read_csv(path,usecols=used_columns)

棘手的部分是，如果其中一列缺失，那么它将无法找到其中一列(我有很多csv文件，它们可能不同)

一个选项是读取整个csv并保存列名并将其带到'speed', 'status'之前，但我试图避免读取整个csv，因为它是一个巨大的文件，我有很多csv文件。

我认为您可以在读取.csv文件时使用nrows=参数。这样，您可以只读取几行(而不是整个文件)，保存列名并只读取文件中存在的列:

df = pd.read_csv(path, nrows=2)
# columns are in df.columns:
print(df.columns)

相关内容