使用 K 均值聚类生成锚框，YOLO

我试图了解YOLO的工作原理以及它如何检测图像中的对象。我的问题是，k均值聚类在检测对象周围的边界框方面起什么作用？谢谢。

K -means 聚类算法是数据科学中非常著名的算法。该算法旨在将n观测值划分为k聚类。主要包括：

分配和更新是重复发生的，直到收敛。最终结果是点及其各自质心之间的平方误差之和最小化。

编辑：

为什么使用 K 表示

它在确定锚框方面真正做了什么

谢谢！

通常，对象的边界框由以下形式的元组给出 (x0，y0，x1，y1) 其中 x0，y0 是左下角的坐标，x1，y1 是右上角的坐标。

需要从这些坐标中提取宽度和高度，并根据图像宽度和高度对数据进行归一化。

K 均值的指标

事实证明，欠条比以前更好

Jaccard 索引 =(所选框和簇头框之间的交集)/(所选框和聚类头框之间的并集)

在初始化时，我们可以选择 k 个随机框作为我们的集群头。根据 IoU 值>阈值将锚框分配给相应的集群，并计算集群的平均 IoU。

这个过程可以重复，直到收敛。

相关内容