小贝子编程

为什么Relu可以解决梯度消失?

本文关键字：消失解决 Relu sigmoid relu
更新时间 : 2023-09-16
英文 : Why can Relu solve vanishing gradient?

当涉及到sigmoid时，由于0~1的大量乘法，第一个边很少更新。我了解到这叫做消失梯度。

但为什么这对Relu来说不是问题呢？我认为relu的第一个边缘也很少更新。

由于relu的derivative要么是 0 要么是 1，那么它的很多乘法不是收敛到 0 吗？

本文对这个问题有一个有趣的讨论： http://proceedings.mlr.press/v15/glorot11a/glorot11a.pdf

特别是，请查看第 318 页上的"潜在问题"部分。这似乎正是因为导数是 0 或 1，但绝不会只是"接近"零(如在 sigmoid 情况下(，这会导致稀疏表示，结果证明有助于训练。

最新更新

运行我的 CI 时没有这样的模块"AWSCore"，在本地很好
APPSCRIPT从Gmail中检索带有电子邮件地址的上次交互日期
Arduino cmake build system without IDE
使用.Split拆分字符串并返回第一个整数值
Docker挂载的卷文件属于nobody:nobody(失去所有者)
气流操作器从URL下载文件并保存到磁盘
我试图在提交表单之前添加一个选中的属性，并使用laravel刀片模板单击无线电粘性
Love2D 错误：main.lua：38：尝试调用方法 'getHeight'(一个 nil 值)
使用稀疏矩阵与jax
对于大一点的孩子(9岁以上的孩子)，我需要什么样的iOS家长门?
Understanding std::vector::push_back(std::move(v[i]))
你能找到解决这个问题的方法吗?
在使用相同group_id的kafka消费者中使用assign而不是subscribe是否有影响? &
让谷歌的见解清楚地表明，我的网站上有不止一个页面
我无法在反应中删除 html 标签
获取/读取邮件消息并输出纯文本
显示:表格单元格与行号不对齐
如何使用Toga应用访问Android通知
访问create_template_view api时出现INVALID_REQUEST_BODY错误
使用预处理器条件生成C/ c++变量名
此处映射计算路线API上的错误414
Oracle数据库中的并行提示
woocommerce在每个类别结帐后自定义重定向
是否有可能在AWS中设置一个webhook来监控特定的电子邮件地址，并将接收到的电子邮件信息传递给Lambda?<
仅使用numpy实现CNN时出错
过程展开不规则时间序列
插入多个带别名的外键
如何从API响应中提取Array
WebLogic 14c -性能调优测试
Google-Drive-API文件没有使用FORM_ID找到

为什么Relu可以解决梯度消失?

相关内容

最新更新

热门标签：