如何在视频流中只计算一次对象?(张量流,CNN)



所以我遇到了一个小问题。假设我有一个人们过马路的视频 - 在这个例子中,假设相机看起来垂直于人们走过的方式(他们相对于相机直接水平行走)。

现在,我想从这段录像中计算过马路的人数。

视频流由 20FPS 素材组成,我的问题是我的 AI 模型评估的每一帧都会返回 X 人(不是我真正感兴趣的)。

所以问题是,我如何评估通过一系列帧的对象,而不是评估对象在任何特定帧中的存在?

我认为的一种可能方法是,当对一个人进行新的预测(例如高于 90% 的阈值)时,为它分配一些唯一的标识,并尝试在帧之间携带该唯一标识符......

似乎可能有一个更简单的方法,有人知道吗?

在做了更多的研究之后,我遇到了另一个稍微相关的Stackoverflow问题:张量流对象检测API(计算车速)。

OpenCV似乎具有跟踪功能。因此,也许我会对框架方块进行初步猜测,然后如果超过某个阈值,我会建议跟踪。

为了进一步的读者参考,有一个名为"单个对象跟踪器"的跟踪器,它结合了对象检测模型,首先评估一个正方形,然后实现一种跟踪器样式。

最新更新