我是R的新手,我遇到了这个问题:我想比较两种预测技术(支持向量机和神经网络(将它们应用于某些数据,我想比较它们的性能。为此,我使用 ROC 曲线。该代码应该计算 ROC 曲线下的面积,但它不起作用。神经网络代码工作正常,但是当 SVM 部分执行时出现此错误:
> aucs <- auc((dtest$recid=="SI"(*1, lr.pred(
roc.default(response, predictor, auc = TRUE, ...( 中的错误: 预测变量必须是数字或有序的。
> obj.roc <- roc((dtest$recid=="SI"(*1, lr.pred (
roc.default((dtest$recid == "SI"( * 1, lr.pred( 中的错误: 预测变量必须是数字或有序的。
这是我的代码。
library(stats)
library(pROC)
library(nnet)
library(e1071)
library(rpart)
data <- read.table("data.csv", header=T)
set.seed(1234)
ind <- sample(2, nrow(data), replace=TRUE, prob=c(0.8, 0.2))
dtrain <- data[ind==1,]
dtest <- data[ind==2,]
# Variables for storing comparison results #
bestAuc = 0
bestIdx = 0
# Support Vector Machines
lr.fit <- svm(recid~., data=dtrain, cost=1000, gamma=1, probability=TRUE)
lr.pred <- predict(lr.fit, dtest, type="response")
aucs <- auc((dtest$recid=="SI")*1, lr.pred)
obj.roc <- roc((dtest$recid=="SI")*1, lr.pred)
print("SVN (default)")
bestAuc = aucs # Initialize
# Neural networks
lr.fit <- nnet(recid~., data=dtrain, size=4, maxit=500, decay=1, trace=FALSE)
lr.pred <- predict(lr.fit, dtest, type="raw")
aucs <- auc((dtest$recid=="SI")*1, lr.pred)
obj.roc <- roc((dtest$recid=="SI")*1, lr.pred )
if(aucs > bestAuc) {
bestAuc <- aucs
bestIdx <- 1
print("Neural networks")
}
我一直在寻找信息,但似乎很少有关于我使用的方法的信息。我看到了一个名为ROCR的软件包,我认为它可能很有用,但是性能功能也出现了错误。我对所有这些库有点迷茫,所以我试图坚持我最初的解决方案,没有任何改进。我该怎么办?
编辑:
该解决方案基于卡利莫的想法。预测的返回值没有以我想要的格式给出数据,所以我需要使用这个:
lr.pred <- attr(lr.pred,"probabilities")[,c("SI")]
该句子获取将在 ROC 曲线中分析的列。
正如错误消息所说,您需要 lr.pred 中的数字向量或有序因子。这里的问题是预测(对于 svm(返回预测的类,这使得 ROC 练习几乎无用。
你需要的是获得一个内部分数,比如班级概率:
lr.pred <- predict(lr.fit, dtest, probability = TRUE)
(您必须选择获得哪个概率,对于第一类或第二类。另请注意,type = "response"
将被忽略。