MNIST训练的网络用我自己的样本测试



我用MNIST数据集训练了一个密集神经网络,以便对28x28的数字图像进行分类。现在我试着用我自己的样本让它工作(我画了一个"7";我把它转换成一个数组),但结果真的很差。

from tensorflow.keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
from tensorflow.keras import models
from tensorflow.keras import layers
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28,)))
network.add(layers.Dense(10, activation='softmax'))
network.compile(optimizer='rmsprop',
loss='categorical_crossentropy',
metrics=['accuracy'])

train_images = train_images.reshape((60000,28*28))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype('float32') / 255
from tensorflow.keras.utils import to_categorical
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
network.fit(train_images,train_labels,epochs=20,batch_size=512,validation_split=0.2)
print(network.evaluate(test_images,test_labels))

#-DEMO-----------------------------------------------------------------
from PIL import Image
import PIL.ImageOps
import os
direccio = 'C:/Users/marcc/OneDrive/Escritorio'
os.chdir(direccio)
myImage = Image.open("Image.PNG").convert('L')
myImage = PIL.ImageOps.invert(myImage)
myImage = myImage.resize((28,28))
myImage.show()
#transforming my image into an array (THE PROBLEM MUST BE HERE)
import numpy as np
myImage_array = np.array(myImage)
myImage_array = myImage_array.reshape((28*28))
myImage_array = myImage_array.astype('float32') / 255
myImage_array=myImage_array.reshape(1,784)
print(myImage_array.shape)

print(network.predict(myImage_array))

DEMO之前的代码由franois Chollet编写。我只做了最后一部分,这是我自己的图像实现。

我用7的图像测试它后得到的结果是:

[[6.9165975e-03 3.0256975e-03 4.9591944e-01 4.8350231e-03 5.6093242e-03
8.6059235e-03 4.5295963e-01 8.3720963e-04 2.1008164e-02 2.8301307e-04]]

正如你所看到的,结果真的很糟糕(第七名的概率应该是最高的)

如果我使用代码绘制MNIST的图像:

digit = train_images[4]
import matplotlib.pyplot as plt
plt.imshow(digit, cmap=plt.cm.binary)
plt.show()

它看起来像:MNIST图像

如果我对我的图像做同样的操作:我的图像7(转换为数组后)

得到的结果是样本属于每个类的概率分布。如果看到结果

[[6.9165975e-03 3.0256975e-03 4.9591944e-01 4.8350231e-03 5.6093242e-03
8.6059235e-03 4.5295963e-01 8.3720963e-04 2.1008164e-02 2.8301307e-04]]

你看到有10个概率你的样本属于第一类(没有1)和第二类(没有2)等等

如果你仔细观察你的输出,你会发现最高概率在第7位,所以模型将你的样本分类为数字7

如果您希望输出的是类的编号,您可以尝试这样做

CATEGORIES = ["1","2","3","4","5","6","7","8","9","0"]
prediction = model.predict('your_sample')
max = (prediction.max(0))
result = (np.where(prediction == max))
print(CATEGORIES[result])

一切正常,我的问题是,在我的区域,7通常是用另一行书写的(我真的认为它更延伸)。因为我使用的是密集网络,它不会解释数字的形状,而是像素的配置,所以对数字的书写方式进行一点修改可能会在这个简单的模型中产生非常糟糕的后果。

7正常书写

正如Αpostolos-Valiakos所说,我真的必须尝试不同的数字。但我真的认为这是一个如何将我的图像转换为数组的问题。感谢大家的帮助

相关内容

最新更新