Cuda 错误消息:F ./tensorflow/core/util/cuda_launch_config.h:127] 检查失败:work_element_count > 0(0 与 0)



我正在尝试在 p2.xlarge EC2 aws 实例上自己的数据集上使用 Keras 训练掩码 rcnn 模型。

当我启动培训时,经过几个训练步骤:

Epoch 1/1    2/1000 [..............................] - ETA: 4:27:49 - loss: 5.1578 - rpn_class_loss: 0.0937 - rpn_bbox_loss: 0.6471 - mrcnn_class_loss: 2.6594 - mrcnn_bbox_loss: 1.1266 - mrcnn_mask_loss:
0.6311

我收到此错误消息:

2018-05-02 13:44:56.193439: F ./tensorflow/core/util/cuda_launch_config.h:127] Check failed: work_element_count > 0 (0 vs. 0)

我的图像相对较小(~100Kb(,数据集中的图像很少(~150(。

我使用的配置如下:

class CustomConfig(Config):
"""Configuration for training on the custom dataset.
Derives from the base Config class
"""
# Give the configuration a recognizable name
NAME = "blabla"
# We use a GPU with 12GB memory, which can fit two images.
# Adjust down if you use a smaller GPU.
IMAGES_PER_GPU = 2
# Number of classes (including background)
NUM_CLASSES = 11

有什么建议吗?谢谢!

我将我的 tensorflow-gpu 包降级到 1.7.0 并且它可以工作

最新更新