我正试图使用deepenet包的dbn.dnn.train函数来训练MNIST数据集。这项任务属于分类任务。我正在使用以下命令
dbn.deepnet <- dbn.dnn.train(train.image.data,train.image.labels,hidden=c(5,5))
我面临的问题是:
1) 标签应该是因子类型向量。但当我输入标签作为因子时,函数会给出一个错误,即"y应该是矩阵或向量"。所以,我使用的标签是数字。如何进行分类任务
2) 为dbn.dnn.train进行预测的函数是什么?我使用的是nn.predict,但文件提到输入应该是由函数nn.train训练的神经网络(没有提到dbn.dnn.train)。所有记录的输出为0.9986
nn.predict(dbn.deepnet,train.image.data)
不知道您是否仍在处理它,或者您是否已经找到了解决方案,但是:1/试试这个:train.image.labels<-数据.矩阵(列车.图像.标签)
2/i使用nn.predict,即使神经网络由dbn.dnn.train.
正如您所知,神经网络的输入值最好在0和1之间。在"deepnet"包中,与nn.train
函数不同,对于dbn.dnn.train
,您需要自己规范化输入。以下是要加载、训练和测试的完整代码。
#loading MNIST
setwd("path/to/MNIST/")
mnist <- load.mnist(".")
# the function to normalize the input values
normalize <- function(x) {
return (x/255)
}
# standardization
train_x_n <- apply(mnist$train$x, c(1,2),FUN = normalize)
test_x_n <- apply(mnist$test$x, c(1,2),FUN = normalize)
#training and prediction
dnn <- dbn.dnn.train(train_x_n, mnist$train$yy, hidden = c(100, 70, 80), numepochs = 3, cd = 3)
err.dnn <- nn.test(dnn, test_x_n, mnist$test$yy)
dnn_predict <- nn.predict(dnn, test_x_n)
# test the outputs
print(err.dnn)
print(dnn_predict[1,])
print(mnist$test$y[1])
输出:
> err.dnn
[1] 0.0829
> dnn_predict[1,]
[1] 7.549055e-04 1.111647e-03 1.946491e-03 7.417489e-03 3.221340e-04 7.306264e-04 4.088365e-05 9.944441e-01 8.953903e-05
[10] 9.085863e-03
> mnist$test$y[1]
[1] 7