我在试图将数据放在熊猫数据框架中的同时面临问题。我有一个数据框,大小为6列,超过22000行。我想使用以下代码在一个小数据框中将其切成薄片:
logs = pd.DataFrame(list(storLogs.find({"idPlc": ObjectId("5c5ae7187910e20087489296")})))
y1 = logs.loc[logs['idType'] == '5c6c189d319f83008487ba3a']
此ID存在于数据框中的多行中,但是当我执行代码时,它返回一个空数据框。
这是我使用的logs.head()
返回的东西 __v _id createdAt
0 0 5c6fbbd5bf8272006ce0c8d1 2019-02-22 09:07:33
1 0 5c6fbbd5bf8272006ce0c8d2 2019-02-22 09:07:33
2 0 5c6fbbd5bf8272006ce0c8d3 2019-02-22 09:07:33
3 0 5c6fbc11bf8272006ce0c8e3 2019-02-22 09:08:33
4 0 5c6fbc11bf8272006ce0c8e4 2019-02-22 09:08:33
idPlc idType value
0 5c5ae7187910e20087489296 5c6c189d319f83008487ba3a 29378
1 5c5ae7187910e20087489296 5c6fbb33319f83008487ba3b 17294
2 5c5ae7187910e20087489296 5c6fbb3a319f83008487ba3c 10012
3 5c5ae7187910e20087489296 5c6c189d319f83008487ba3a 29378
4 5c5ae7187910e20087489296 5c6fbb33319f83008487ba3b 17294
其他可能的解决方案之一是使用 df.query
还指定选择行的标准,例如:
logs.query("idType == '5c6c189d319f83008487ba3a'")
支持此概念的一个因素是,尤其是对于大数据框架, query 是一个非常有效的解决方案。