我有一个包含以下列的数据框:Folder_Number、File_Name、Val_Indices和Final_Result。Val_Indices和Final_Result可以采用值:0、1 或 2
示例数据
+---------------+-----------+-------------+--------------+
| Folder_Number | File_Name | Val_Indices | Final_Result |
+===============+===========+=============+==============+
| 100 | ABC.png | 0 | 1 |
+---------------+-----------+-------------+--------------+
| 100 | DEF.png | 0 | 0 |
+---------------+-----------+-------------+--------------+
| 100 | EFG.png | 0 | 1 |
+---------------+-----------+-------------+--------------+
| 200 | HIJ.png | 1 | 0 |
+---------------+-----------+-------------+--------------+
| 200 | KLM.png | 1 | 1 |
+---------------+-----------+-------------+--------------+
| 300 | NOP.png | 2 | 2 |
+---------------+-----------+-------------+--------------+
我希望数据按Folder_Number分组,并且Final_Result对应于该Folder_Number的所有行的值应为该组中值的最小值。
例如,对应于Folder_Number = 100
,我希望文件夹编号 100 的所有行都有Final_Result = 0
(最小值 1、0、1(。
同样,对应于文件夹编号 200,所有行都应具有Final_Result = 0
(最小值为 0 和 1(。
对应于文件夹编号 300,所有行都应具有Final_Result = 2
(文件夹 300 只有 1 个Final_Result
值(
你可以做
df['Final_Result'] = df.groupby('Folder_Number')['Val_Indices'].transform(min)