我希望有人能帮我——我是新手。我希望有一个9 x 5000的数据帧,第一行看起来像这样:
Article IDInclude 0.3 1.4 1.5 1.6 1.7 1.9 2.0 2.3 2.5 3.2
0 4514313 False False NaN NaN 0.0 1.0 0.0 1.0 1.0 0.0 1.0
1 4514313 False False NaN NaN 1.0 1.0 1.0 0.0 NaN 0.0 1.0
2 8420104 True True 0.0 1.0 1.0 0.0 NaN 1.0 0.0 1.0 1.0
我想找到F1的成绩。每个";文章ID";在数据集中出现两次,每个编码器一次,我想比较文章ID相同的行。有没有办法让第一次出现的文章ID y_true和第二次出现的y_pred。
sklearn.metrics.f1_score(y_true, y_pred, *, labels=None, pos_label=1, average='binary', sample_weight=None, zero_division='warn')
Thank you!
也许可以试试这个:
grouped = df.groupby('Article ID')
df_true = grouped.first().reset_index()
df_pred = grouped.last().reset_index()