重新缩放神经网络中的输入特征



我正在阅读《制作你自己的神经网络》一书,在这个关于如何对手写数字进行分类的例子中,文本中说,0到255范围内的输入颜色值将被重新缩放到0.01到1.0之间的小得多的范围。有几个问题!

  1. 使用0到255的实际范围有什么反对意见?重新缩放会给我带来什么?

  2. 这是否意味着,如果我重新缩放我的训练集,用这个重新缩放的数据训练我的模型,那么我也应该使用重新缩放的测试数据?

有什么争论吗?

使用梯度下降等方法时,重新缩放数据将加快收敛速度。此外,当数据集的大小变化很大时,使用包含欧氏距离的解决方案可能会导致糟糕的结果。为了避免这种情况,明智的解决方案是将特征缩放到0.0到1.0之间。

对于第二个问题,您应该重新缩放测试数据。

单击这些链接1、2和3以获取更多信息。

最新更新