我正在尝试找到用于处理Tensorflow CNN图像识别项目的遮挡对象的方法。基础物体大多可见,但是相似的对象经常越过。大多数交叉点实际上都是跨形(但并非总是如此(。想想在桌子上扔一堆弯曲的牙签或一块电线。可能的优势:大多数对象具有相似的结构,但具有各种尺寸和各种弯曲。
这是否需要某种预处理步骤,还是可以通过CNN中的某些过程严格处理它?我可以通过Sobel/Canny/其他任何东西来概述对象的轮廓。问题是我是否可以避免编写乏味的手工编码功能来分开对象。
对已知作品或论文的任何想法或引用!
查看CNN的基本结构:在第一层中,您有许多地图描述了可能的本地特征。由于对象重叠是有限的,因此您仍然会从非重叠零件中获得强烈的信号。随后的层应该能够处理这一点,尤其是如果他们接受了如此重叠的培训。
显然,您需要培训。CNN不知道对象是什么,因此VV
和W
之间的区别取决于网络是否使用W
训练。如果网络从未见过W
,而只有V
,则W
将被识别为VV
。