小贝子编程

Theano中梯度的Nan误差

本文关键字：Nan 误差 Theano theano
更新时间 : 2023-09-08
英文 : Nan error of gradients in Theano

当我构造这样的计算时

p_1 = 1 / (1 + T.exp(-T.dot(x, (w1-w2)) - (b1-b2)))

W1、

W2、B1、B2 是参数。我构造了一个交叉熵作为损失函数。

但是当我采取渐变时

T.grad(loss,[w1, b1, w2, b2])

所有得到的梯度都是楠。

这个问题有什么可能的原因吗？有什么解决方案吗？

提前谢谢你！

我得到了解决方案。基本上是数值不稳定。通过将日志 sigmoid 更改为 softplus 解决了这个问题。

最新更新

SwiftUI：Foreach in List - 有什么优势？
如何加载所有转储附加的字典在python pickle?
Jmeter语言 - 当前活动线程
Java作用域问题:try-catch块，解析字符串到日期
如何在主应用中获得UWP应用服务的通知?
复选框的定位
弹簧启动-采用与2个ymls不同的属性
Symfony 5.3+翻译提供商Crowdin不更新本地文件
从文本文件(.txt)中读取字节数组
如何下载完整的雅典娜查询结果到CSV文件
pyspark:在执行join - restrict相同列名选择时设置别名
如何在Eclipse RCP中隐藏/删除Preferences对话框中的导入/导出按钮
在自定义jackson反序列化器中以响应式方式从db加载实体
使用RestSharp从API返回JSON数据
OAuth同意屏幕不显示正确的AppName
使用ByRef更新记录集字段
提取多个XML文件中所有标签之间的文本，并将提取的文本复制到csv文件中
在Laravel和Vue之间共享数据的糟糕方式
可以在Azure Devops中找到需求文本文件
如何在tensorflow keras中引用ground truth变量?
Json解析并分配给DTO
如何通过不重复结果来正确地循环一个范围
给出零最优值的AMPL程序
再次出现身份验证问题，GCP源存储库使用publickey
打印添加到数据库的记录数有问题
如何插入一行到一个表在sql是完全相同的另一个表，但只有一个列不同?
如何在jupyter notebook中导入两个或多个包?
对product类型的访问器进行泛型迭代
如何在 react 中"remember"昂贵的递归函数中先前计算的值？
在eclipse IDE上使用Tomcat服务器在本地机器上修复eclipse上的编译错误，我能做些什么?

Theano中梯度的Nan误差

相关内容

最新更新

热门标签：