如何使用Python绘制ROC曲线和精度

从由va1、val1和weight组成的数据帧中，我创建了一个训练集和一个测试集。我使用了一些指标，并将它们与测试集进行了比较。相应的(true(值保存在true_positive_df数据帧内，而不匹配的值保存在False_positive_df数据帧中。

True_positive_df:
val1  val2  weight
123   345   67.09
453   256   43.51
...   ...   ...
False_positive_df:
val1  val2 weight
789   878 90.23
782   293  62.53 
...   ...  ...

我想创建一个ROC曲线，并计算计算的准确性。如何使用这两个数据帧来完成此操作？

我知道，通常要创建ROC曲线，你需要像这样的参数x和y：

import scikitplot as skplt
import matplotlib.pyplot as plt
y_true = # ground truth labels
y_probas = # predicted probabilities generated by sklearn classifier
skplt.metrics.plot_roc_curve(y_true, y_probas)
plt.show()

数据和目标，但我不清楚我应该准确绘制什么，插入什么数据，以及的数据帧

根据片段中的数据帧判断，您处理的是回归问题，而不是分类问题。这意味着您不是在尝试预测观测值的类别，而是特定的值(我假设是weight变量(
因为您没有尝试对观察结果进行分类，所以诸如真阳性率或假阳性率之类的指标没有得到很好的定义。因此，ROC曲线不能在回归问题的背景下创建。

你可以在这里找到更多信息。

相关内容

最新更新

热门标签：