本题要求用 K-means 在宽高空间对检测框进行聚类,以获得 YOLO 的 Anchor 尺寸。与欧氏距离不同,这里采用 d = 1 − IOU 作为距离度量,能更贴近目标检测中对宽高匹配的要求。
算法选择与要点
【背景信息】YOLO (You Only Look Once) 系列算法在目标检测领域采用了基于Anchor的机制。Anchor是预定义在图像上的一组固定尺寸和比例的参考框,在特征图的每个位置上预设多个Anchor框作为物体位置和尺寸预测的基准。通过模型预测Anchor与真实框的偏移量(Δx,Δy,Δw,Δh),而非直接输出坐标,避免了直接回归绝对坐标的困难。
【任务目标】 基于k-means聚类算法生成YOLO目标检测中的Anchor框:给定N个检测框的宽和高,聚类得到K个Anchor尺寸,并按照面积从大到小的顺序输出Anchor尺寸。
【任务目标】
基于k-means聚类算法生成YOLO目标检测中的Anchor框:给定N个检测框的宽和高,聚类得到K个Anchor尺寸,并按照面积从大到小的顺序输出Anchor尺寸。
开通会员即可查看完整视频题解: 1.题目讲解 2.思路分析 3.逐行代码手写