如何在视频流中只计算一次对象?(张量流，CNN)

所以我遇到了一个小问题。假设我有一个人们过马路的视频 - 在这个例子中，假设相机看起来垂直于人们走过的方式(他们相对于相机直接水平行走)。

现在，我想从这段录像中计算过马路的人数。

视频流由 20FPS 素材组成，我的问题是我的 AI 模型评估的每一帧都会返回 X 人(不是我真正感兴趣的)。

所以问题是，我如何评估通过一系列帧的对象，而不是评估对象在任何特定帧中的存在？

我认为的一种可能方法是，当对一个人进行新的预测(例如高于 90% 的阈值)时，为它分配一些唯一的标识，并尝试在帧之间携带该唯一标识符......

似乎可能有一个更简单的方法，有人知道吗？

在做了更多的研究之后，我遇到了另一个稍微相关的Stackoverflow问题：张量流对象检测API(计算车速)。

OpenCV似乎具有跟踪功能。因此，也许我会对框架方块进行初步猜测，然后如果超过某个阈值，我会建议跟踪。

为了进一步的读者参考，有一个名为"单个对象跟踪器"的跟踪器，它结合了对象检测模型，首先评估一个正方形，然后实现一种跟踪器样式。

相关内容