从支持向量机转向神经网络(反向传播)



我正在处理文本识别,目前我使用的是支持向量机方法。我也想试试神经网络。我读了一些关于神经网络如何工作的文件,但理论很重,我不知道它将如何应用于我的案例。因此,如果有人能帮我把它说清楚,那就太好了,尤其是在神经网络的架构方面。

  • 目前,在SVM中,我有200个特征(分为4个主要类别),用于识别文本。如果我转向神经网络,有200个特征,这是否意味着我将在输入层中有200个中子
  • 有了200个功能,这将如何产生神经系统的架构网络(根据数字层(隐藏层)和中子)
  • 在SVM中,我有一类分类(基本上是真分类和假分类)和多类分类(标签),这种差异将如何应用于神经网络的输出层

我还有一些一般性的问题:

  • 什么有助于决定隐藏层的数量和每个隐藏层内的中子数量
  • 隐藏层的数量与准确性有关吗

我是神经网络的新手,所以如果你能以一种理解的方式向我解释,那就太好了。:)
非常感谢。

点1-它将是200个输入神经元,其中每个神经元都被输入一个二进制数或一个浮点值(最好在-1到1的范围内归一化)。

第2/4点-大多数问题都是通过一个隐藏层来解决的。当然,如果你从神经网络开始,你应该坚持一个隐藏层。我还建议从少于200个输入神经元开始,尝试5个或10个。多个隐藏层用于复杂问题,例如,第一个隐藏层学习狗、猫、马等宏观特征,下一个隐藏层则学习眼睛、鼻子、耳朵等精细特征。

没有明确的程序来决定隐藏神经元的数量。一个问题越复杂,理论上它需要的隐藏神经元就越多。如果你有10个输入神经元,从20个隐藏神经元开始。如果它不起作用,那么其他地方可能出了问题。如果它确实有效,你可以减少隐藏神经元的数量,直到它失败
你也可以低起点,高起点。

第3点-对于真分类和假分类,使用单个输出神经元,并用0或1对其进行训练。对于n个类,使用n中的1编码。

第5点-没有。准确度是通过网络的泛化能力来衡量的,也就是说,它对从未见过的数据的表现。一般来说,更多的训练数据=更准确。

最新更新