Panda数据帧逐行比较中的F1分数



我希望有人能帮我——我是新手。我希望有一个9 x 5000的数据帧,第一行看起来像这样:

Article IDInclude 0.3     1.4 1.5 1.6 1.7 1.9 2.0 2.3 2.5 3.2 
0   4514313 False   False   NaN NaN 0.0 1.0 0.0 1.0 1.0 0.0 1.0
1   4514313 False   False   NaN NaN 1.0 1.0 1.0 0.0 NaN 0.0 1.0
2   8420104 True    True    0.0 1.0 1.0 0.0 NaN 1.0 0.0 1.0 1.0

我想找到F1的成绩。每个";文章ID";在数据集中出现两次,每个编码器一次,我想比较文章ID相同的行。有没有办法让第一次出现的文章ID y_true和第二次出现的y_pred。

sklearn.metrics.f1_score(y_true, y_pred, *, labels=None, pos_label=1, average='binary', sample_weight=None, zero_division='warn')

Thank you! 

也许可以试试这个:

grouped = df.groupby('Article ID')
df_true = grouped.first().reset_index()
df_pred = grouped.last().reset_index()

相关内容

  • 没有找到相关文章

最新更新