在CNN模型中使用正则化子时,角膜被冻结



我在keras中使用TensorFlow后端运行了一个自定义CNN实现。为了提高可推广性,我正在努力将正则化添加到CNN模型中。该模型在没有任何活动/内核正则化的情况下工作良好。当我添加一个活动/内核正则化时,模型就冻结在两者之间;训练通常在单个历元的批次/迭代之间停止(例如67/172批次(。这个问题在我的系统上是非常可重复和可复制的,我能够将问题定位到正则化的实现中。看到这种行为很奇怪,其他人也找不到类似的问题。我不确定我是否需要提供任何额外的信息,如果有人能指导我缺少什么,我将非常乐意提供所需的信息,并将非常感谢对该问题的指导。

以下是一些有用的信息,如库/依赖

  1. Keras 2.4.3
  2. Tensorflow 2.3.1
  3. GPU:NVIDIA 1070 TI(8GB(
  4. cudart64_101.dll已成功打开T
  5. 该代码是用Spyder在Python 3.8上运行编写的
  6. 输入:32个批量大小,输入大小(32256,64,1(
  7. 使用model.fit函数训练模型
  8. 100277个参数,99523个可训练

事实上,我认为这个问题是在我将NVIDIA软件更新到最新版本(11.1(并将最新版本添加到路径后解决的

最新更新