我在keras中使用TensorFlow后端运行了一个自定义CNN实现。为了提高可推广性,我正在努力将正则化添加到CNN模型中。该模型在没有任何活动/内核正则化的情况下工作良好。当我添加一个活动/内核正则化时,模型就冻结在两者之间;训练通常在单个历元的批次/迭代之间停止(例如67/172批次(。这个问题在我的系统上是非常可重复和可复制的,我能够将问题定位到正则化的实现中。看到这种行为很奇怪,其他人也找不到类似的问题。我不确定我是否需要提供任何额外的信息,如果有人能指导我缺少什么,我将非常乐意提供所需的信息,并将非常感谢对该问题的指导。
以下是一些有用的信息,如库/依赖
- Keras 2.4.3
- Tensorflow 2.3.1
- GPU:NVIDIA 1070 TI(8GB(
- cudart64_101.dll已成功打开T
- 该代码是用Spyder在Python 3.8上运行编写的
- 输入:32个批量大小,输入大小(32256,64,1(
- 使用model.fit函数训练模型
- 100277个参数,99523个可训练
事实上,我认为这个问题是在我将NVIDIA软件更新到最新版本(11.1(并将最新版本添加到路径后解决的