从支持向量机转向神经网络(反向传播)

我正在处理文本识别，目前我使用的是支持向量机方法。我也想试试神经网络。我读了一些关于神经网络如何工作的文件，但理论很重，我不知道它将如何应用于我的案例。因此，如果有人能帮我把它说清楚，那就太好了，尤其是在神经网络的架构方面。

我还有一些一般性的问题：

我是神经网络的新手，所以如果你能以一种理解的方式向我解释，那就太好了。：)
非常感谢。

点1-它将是200个输入神经元，其中每个神经元都被输入一个二进制数或一个浮点值(最好在-1到1的范围内归一化)。

第2/4点-大多数问题都是通过一个隐藏层来解决的。当然，如果你从神经网络开始，你应该坚持一个隐藏层。我还建议从少于200个输入神经元开始，尝试5个或10个。多个隐藏层用于复杂问题，例如，第一个隐藏层学习狗、猫、马等宏观特征，下一个隐藏层则学习眼睛、鼻子、耳朵等精细特征。

没有明确的程序来决定隐藏神经元的数量。一个问题越复杂，理论上它需要的隐藏神经元就越多。如果你有10个输入神经元，从20个隐藏神经元开始。如果它不起作用，那么其他地方可能出了问题。如果它确实有效，你可以减少隐藏神经元的数量，直到它失败
你也可以低起点，高起点。

第3点-对于真分类和假分类，使用单个输出神经元，并用0或1对其进行训练。对于n个类，使用n中的1编码。

第5点-没有。准确度是通过网络的泛化能力来衡量的，也就是说，它对从未见过的数据的表现。一般来说，更多的训练数据=更准确。

相关内容