Keras model.predict使用sigmoid激活和二进制交叉熵只返回0或1,不返回概率



我正在用重叠的类预测在 Keras 中构建 NN。据我了解,"sigmoid"激活函数应该返回属于一个类的概率。但是,当我尝试使用 model.predict(...( 时,它只返回零或一。你能告诉我我哪里出错了,我怎样才能获得属于一个班级的概率吗?

input_stock = Input(shape=input_shape,dtype='float32')  
stock_data= Conv2D(32, (1,5), padding='same', activation='relu')(input_stock)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data= Conv2D(8, (1,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,5),strides=(1,5))(stock_data)
stock_data= Conv2D(8, (154,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data=Flatten()(stock_data)
stock_data=Dropout(.5)(stock_data)
output_layer = Dense(maxnumassets, activation='sigmoid')(stock_data)

model = Model(inputs=input_stock, outputs=output_layer)

return model

Output of model.predict (there are 150 classes), looks like below. 
array([[1., 1., 0., 0., 1., 1., 0., 1., 0., 0., 0., 1., 0., 1., 1., 1.,
0., 0., 1., 1., 0., 0., 1., 0., 0., 1., 0., 0., 0., 0., 1., 0.,
0., 1., 0., 0., 1., 1., 1., 1., 0., 1., 1., 0., 0., 0., 0., 1.,
0., 1., 1., 1., 1., 1., 0., 0., 0., 0., 1., 1., 1., 0., 0., 1.,
0., 0., 0., 1., 1., 0., 0., 0., 0., 0., 0., 0., 0., 1., 1., 1.,
1., 1., 0., 0., 1., 1., 1., 0., 0., 0., 1., 0., 1., 0., 0., 0.,
1., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 1., 1., 0., 1., 1.,
0., 0., 1., 1., 1., 0., 0., 0., 0., 1., 1., 0., 1., 1., 1., 1.,
0., 0., 0., 1., 1., 0., 0., 0., 1., 0., 1., 0., 1., 0., 1., 1.,
1., 1., 0., 0., 0., 0.]], dtype=float32)'''
Dimensions of the data are as follows:
train (715, 150, 100, 2)
ytrain (715, 150)
xtest (80, 150, 100, 2)
ytest (80, 150)

> 如果你只是直接使用model.predict(xtest),那么你的代码通常会给出 0 和 1 以外的值,参见下面的示例,它除了将模型应用于随机数据外什么都不做。

如果你的模型没有,可能是你过度拟合,或者你的模型只是完美地拟合了你的数据。尝试将model.predict应用于与数据无关的数组。

另一件似乎不对劲的事情是,您在示例中给出了一个形状(1, 150)数组,但是如果xtest.shape确实是(80, 150, 100, 2),那么model.predict(xtest).shape(80, 150)

input_shape = (150, 100, 2)
maxnumassets = 150
input_stock = Input(shape=input_shape,dtype='float32')
stock_data = Conv2D(32, (1,5), padding='same', activation='relu')(input_stock)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data = Conv2D(8, (1,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,5),strides=(1,5))(stock_data)
stock_data = Conv2D(8, (154,5), padding='same', activation='relu')(stock_data)
stock_data = MaxPooling2D((1,2),strides=(1,2))(stock_data)
stock_data = Flatten()(stock_data)
stock_data = Dropout(.5)(stock_data)
output_layer = Dense(maxnumassets, activation='sigmoid')(stock_data)
model = Model(inputs=input_stock, outputs=output_layer)
train = np.random.uniform(size=(775, 150, 100, 2))
ytrain = np.random.uniform(size=(775, 150))
xtest = np.random.uniform(size=(80, 150, 100, 2))
ytest = np.random.uniform(size=(80, 150))
model.compile('adam', 'mse')
model.fit(train, ytrain)
model.predict(xtest)

输出:

array([[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
0.4994816 ],
[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
0.4994816 ],
[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
0.4994816 ],
...,
[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
0.4994816 ],
[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
0.4994816 ],
[0.50180054, 0.49852884, 0.49954456, ..., 0.4990623 , 0.49985167,
0.4994816 ]], dtype=float32)

最新更新