如何使用Python绘制ROC曲线和精度



从由va1、val1和weight组成的数据帧中,我创建了一个训练集和一个测试集。我使用了一些指标,并将它们与测试集进行了比较。相应的(true(值保存在true_positive_df数据帧内,而不匹配的值保存在False_positive_df数据帧中。

True_positive_df:
val1  val2  weight
123   345   67.09
453   256   43.51
...   ...   ...
False_positive_df:
val1  val2 weight
789   878 90.23
782   293  62.53 
...   ...  ...

我想创建一个ROC曲线,并计算计算的准确性。如何使用这两个数据帧来完成此操作?

我知道,通常要创建ROC曲线,你需要像这样的参数x和y:

import scikitplot as skplt
import matplotlib.pyplot as plt
y_true = # ground truth labels
y_probas = # predicted probabilities generated by sklearn classifier
skplt.metrics.plot_roc_curve(y_true, y_probas)
plt.show()

数据和目标,但我不清楚我应该准确绘制什么,插入什么数据,以及的数据帧

根据片段中的数据帧判断,您处理的是回归问题,而不是分类问题。这意味着您不是在尝试预测观测值的类别,而是特定的值(我假设是weight变量(
因为您没有尝试对观察结果进行分类,所以诸如真阳性率或假阳性率之类的指标没有得到很好的定义。因此,ROC曲线不能在回归问题的背景下创建。

你可以在这里找到更多信息。

最新更新