在熊猫中基于分组依据的数据框修改



我有一个包含以下列的数据框:Folder_NumberFile_NameVal_IndicesFinal_ResultVal_IndicesFinal_Result可以采用值:0、1 或 2

示例数据

+---------------+-----------+-------------+--------------+
| Folder_Number | File_Name | Val_Indices | Final_Result |
+===============+===========+=============+==============+
|      100      | ABC.png   |      0      |       1      |
+---------------+-----------+-------------+--------------+
|      100      | DEF.png   |      0      |       0      |
+---------------+-----------+-------------+--------------+
|      100      | EFG.png   |      0      |       1      |
+---------------+-----------+-------------+--------------+
|      200      | HIJ.png   |      1      |       0      |
+---------------+-----------+-------------+--------------+
|      200      | KLM.png   |      1      |       1      |
+---------------+-----------+-------------+--------------+
|      300      | NOP.png   |      2      |       2      |
+---------------+-----------+-------------+--------------+

我希望数据按Folder_Number分组,并且Final_Result对应于该Folder_Number的所有行的值应为该组中值的最小值。

例如,对应于Folder_Number = 100,我希望文件夹编号 100 的所有行都有Final_Result = 0(最小值 1、0、1(。

同样,对应于文件夹编号 200,所有行都应具有Final_Result = 0(最小值为 0 和 1(。

对应于文件夹编号 300,所有行都应具有Final_Result = 2(文件夹 300 只有 1 个Final_Result值(

你可以做

df['Final_Result'] = df.groupby('Folder_Number')['Val_Indices'].transform(min)

最新更新