我正试图在keras
:中构建一个非常简单的多层感知器(MLP(
model = Sequential()
model.add(Dense(16, 8, init='uniform', activation='tanh'))
model.add(Dropout(0.5))
model.add(Dense(8, 2, init='uniform', activation='tanh'))
sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimizer=sgd)
model.fit(X_train, y_train, nb_epoch=1000, batch_size=50)
score = model.evaluate(X_test, y_test, batch_size=50)
我的训练数据形状:X_train.shape
给出(34180, 16)
标签属于形状为的二进制类:y_train.shape
给出(34180,)
所以我的keras
代码应该产生具有以下连接的网络:16x8 => 8x2
产生形状失配误差:
ValueError: Input dimension mis-match. (input[0].shape[1] = 2, input[1].shape[1] = 1)
Apply node that caused the error: Elemwise{sub,no_inplace}(Elemwise{Composite{tanh((i0 + i1))}}[(0, 0)].0, <TensorType(float64, matrix)>)
Inputs types: [TensorType(float64, matrix), TensorType(float64, matrix)]
Inputs shapes: [(50, 2), (50, 1)]
Inputs strides: [(16, 8), (8, 8)]
在CCD_ 8的CCD_。我在喀拉拉邦监督一些显而易见的事情吗?
编辑:我已经完成了这里的问题,但没有解决我的问题
我遇到了同样的问题,然后找到了这个线程;
https://github.com/fchollet/keras/issues/68
您似乎可以声明2的最终输出层,或者对于任何数量的类别,标签都需要是分类类型的,其中本质上这是每个观察的二进制向量,例如,3类输出向量[0,2,1,0,1,0]变为[[1,,0]、[0,0,1]、[0,1,0]、[1,0,0]、[0.0,1,0]、[10,0]]。
np_utils.to_categorical函数为我解决了这个问题;
from keras.utils import np_utils, generic_utils
y_train, y_test = [np_utils.to_categorical(x) for x in (y_train, y_test)]