处理CNN图像识别中的遮挡对象

我正在尝试找到用于处理Tensorflow CNN图像识别项目的遮挡对象的方法。基础物体大多可见，但是相似的对象经常越过。大多数交叉点实际上都是跨形(但并非总是如此(。想想在桌子上扔一堆弯曲的牙签或一块电线。可能的优势：大多数对象具有相似的结构，但具有各种尺寸和各种弯曲。

这是否需要某种预处理步骤，还是可以通过CNN中的某些过程严格处理它？我可以通过Sobel/Canny/其他任何东西来概述对象的轮廓。问题是我是否可以避免编写乏味的手工编码功能来分开对象。

对已知作品或论文的任何想法或引用！

查看CNN的基本结构：在第一层中，您有许多地图描述了可能的本地特征。由于对象重叠是有限的，因此您仍然会从非重叠零件中获得强烈的信号。随后的层应该能够处理这一点，尤其是如果他们接受了如此重叠的培训。

显然，您需要培训。CNN不知道对象是什么，因此VV和W之间的区别取决于网络是否使用W训练。如果网络从未见过W，而只有V，则W将被识别为VV。

相关内容