创建循环以从数据帧中动态选择行,然后将所选行附加到另一个数据帧:df.query()



我目前正在熊猫中处理数据帧。总之,我有一个名为"Claims"的数据帧,其中填充了客户索赔数据,我想根据字段"Part ID"中的唯一值解析数据帧中的所有行。然后,我想取每组行,并将其一次一个地附加到名为"emptydf"的空数据帧中。该数据帧与"Claims"数据帧具有相同的列标题。由于"Part ID"列中的值每周都在变化,我想找到一些动态的方法来实现这一点,而不是每周手动梳理数据帧。我想以某种方式将df.where()表达式和For循环结合起来,但不知道如何将其组合在一起。任何关于如何做到这一点的见解,甚至一些更好的方法,都将是很棒的!到目前为止,我的代码分为以下两个步骤:

  1. emptydf=索赔[0:0]

#创建空数据帧

2.Parse_Claims=索赔.query('Part_ID==1009')

emptydf=emptydf.append(Parse_Claims)

#根据每个唯一的部件ID号解析数据帧,并将其附加到空数据帧中。正如你所看到的,到目前为止,我一次只能硬编码一个零件ID号。这将需要几个小时才能手动完成,所以我很想找到一种方法来遍历Part ID列并动态附加数据

不用说,我是Python的新手,所以我非常感谢你的耐心!

empty_df = list(Claims.groupby(Claims['Part_ID']))

这将创建一个元组列表,每个元组有两个元素,第一个是部分id,第二个是该部分id的子集

最新更新