从由va1、val1和weight组成的数据帧中,我创建了一个训练集和一个测试集。我使用了一些指标,并将它们与测试集进行了比较。相应的(true(值保存在true_positive_df数据帧内,而不匹配的值保存在False_positive_df数据帧中。
True_positive_df:
val1 val2 weight
123 345 67.09
453 256 43.51
... ... ...
False_positive_df:
val1 val2 weight
789 878 90.23
782 293 62.53
... ... ...
我想创建一个ROC曲线,并计算计算的准确性。如何使用这两个数据帧来完成此操作?
我知道,通常要创建ROC曲线,你需要像这样的参数x和y:
import scikitplot as skplt
import matplotlib.pyplot as plt
y_true = # ground truth labels
y_probas = # predicted probabilities generated by sklearn classifier
skplt.metrics.plot_roc_curve(y_true, y_probas)
plt.show()
数据和目标,但我不清楚我应该准确绘制什么,插入什么数据,以及的数据帧
根据片段中的数据帧判断,您处理的是回归问题,而不是分类问题。这意味着您不是在尝试预测观测值的类别,而是特定的值(我假设是weight
变量(
因为您没有尝试对观察结果进行分类,所以诸如真阳性率或假阳性率之类的指标没有得到很好的定义。因此,ROC曲线不能在回归问题的背景下创建。
你可以在这里找到更多信息。