运行TensorFlow图像识别API以搜索对象



tensorflow具有使用Inception V3模型来识别对象的API。我想知道,是否有任何方法可以在较大的图像中找到较小的图像。例如,在橙树上定位所有橙色。我尝试将较大的图像分为较小的图像的网格并在每个较小的图像上施加Tensorflow,但是具有恒定网格非常容易出错,是否有任何解决方案?

您正在寻找的术语是对象检测。您可以在不同尺度上使用滑动窗口。这是一种方式,可能有更好的方法,但是我不知道它们是什么。

假设有些橙子比其他橙色更近。从左上角的10x10(或某物)框开始,看看您的模型是否将其分类为橙色。将盒子移动到右2像素(或其他)。再试一次。继续向右移动,然后向下移动2个像素,然后启动一个新的行,等等。现在将图像大小调整为较小(因此现在您正在寻找较大的橙色),然后重复整个过程。您可以搜索诸如"滑动窗口检测"one_answers"图像金字塔"之类的东西以了解更多信息。

一旦完成了图像,就会有很多检测 - 您必须在检测到非最大抑制作用上,因为您可能有太多了。

最新更新