iOS中给定图像的多个自定义对象检测(图像处理)



我想用它的框架检测自定义对象。

  • 我已经检查过这一点,我得到了许多 ARKit 实现 - 使用它我们可以获得实时对象检测(即使用输入流作为相机流(,但我的要求是从给定/静态图像中获取它。

  • 我找到了最新的iOS指南/示例,使用相机作为输入流,提供分类或矩形或面部检测等。

    • 我的问题是我需要从具有自定义多个对象的给定图像中获取它。

      例如,我需要识别给定图像中的时钟(具有多个不同类型的时钟的墙壁的图像(,在这里我可以提供示例时钟图像。所以我需要得到识别的时钟及其框架。

      我已经使用Vision的VNImageBasedRequest进行了对象分类检查,其中我可以使用自定义训练的CoreML模型获得分类,但是没有获得边界框属性来获取帧,这在VNDetectedObjectObservation中可用。

提前感谢您宝贵的时间和回复。

你可以利用Google Cloud AutoML Vision Object Detection来做到这一点。如果要检测自定义对象,则需要创建自己的自定义模型数据集并进行训练。训练模型后,您可以将其托管在云上并从 iOS 应用程序进行 API 调用以检测静态图像中的对象(在线(,或者您可以将训练的模型添加到项目中以检测图像中的对象(离线(。您可以在此处找到完整的文档 https://cloud.google.com/vision/automl/object-detection/docs/before-you-begin

如果您能够以任何其他方式完成它,请告诉我如何操作,即使我正在处理类似的用例。

最新更新