谁能解释一下我在 RBM 中用 -h_j * x_k 和 - h_j(x) * x_k 计算导数之间的区别?我找到了两种实现的源代码,但我不确定哪个更好(为什么?
h_j 和 h_j(x) 是指 j^th 隐藏神经元样本还是 j^th 隐藏神经元 sigmoidal 激活?假设如此,如果您计算负对数似然函数的导数,结果为 P(h_j = 1) * x_k。
谁能解释一下我在 RBM 中用 -h_j * x_k 和 - h_j(x) * x_k 计算导数之间的区别?我找到了两种实现的源代码,但我不确定哪个更好(为什么?
h_j 和 h_j(x) 是指 j^th 隐藏神经元样本还是 j^th 隐藏神经元 sigmoidal 激活?假设如此,如果您计算负对数似然函数的导数,结果为 P(h_j = 1) * x_k。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium