这是我的熊猫数据帧:
日期时间 | 序列号 | 值数据1 | 数据2 | 数据3 | 数据4>数据5>数据6 | ||||
---|---|---|---|---|---|---|---|---|---|
2020-09-29T14:59:13.4461479+02:00 | 701 | 24.5113.556 | 3.5573.555 | 3.551 | |||||
2020-09-29T15:48:04.6368679+02:00 | 702 | 24.516 | 3.554 | >td>3.5553.556>3.552 | 3.557 | ||||
2020-09-29T15:51:46.2555875+02:00 | 703 | 24.517 | 3.553 | 3.5563.551 | >3.553|||||
2020年10月01日12:51:59.2687665+02:00 | 704 | 24.5193.552 | 3.5573.556 | 3.5593.557 | 3.5 57 | ||||
2021-02-01T19:27:09.0472459+02:00 | 705 | 24.511 | 3.551 | 3.558 | 3.550 | >3.551 | 3.552 | ||
要获得包含所有异常值的DF:
df_outliers = df.loc[df['Values'].isin(outlier_values), :]
只获取一行:
df_outliers = df.loc[df['Values'].eq(single_value), :]
如果您有多个具有相同值的行,它会找到所有这些行。
只保留原始df:中的某些列
cols = ['data1', 'data2']
df_outliers = df.loc[df['Values'].isin(outlier_values), cols]