当前位置：首页 > news >正文

YOLOv9改进策略【损失函数篇】| Shape-IoU：考虑边界框形状和尺度的更精确度量

news 2025/4/26 18:03:34

一、本文介绍

本文记录的是改进YOLOv9的损失函数，将其替换成Shape-IoU。现有边界框回归方法通常考虑GT（Ground Truth）框与预测框之间的几何关系，通过边界框的相对位置和形状计算损失，但忽略了边界框本身的形状和尺度等固有属性对边界框回归的影响。为了弥补现有研究的不足，Shape-IoU提出了一种关注边界框本身形状和尺度的边界框回归方法。

文章目录

一、本文介绍
二、Shape-IoU设计原理
- 2.1 原理
- 2.2 优势
三、Shape-IoU的实现代码
四、添加步骤
- 4.1 修改utils\metrics.py
- 4.2 修改utils\loss_tal_dual.py

二、Shape-IoU设计原理

Shape-IoU:考虑边界框形状和尺度的更精确度量

以下是关于Shape-IoU的详细介绍：

2.1 原理

分析边界框回归特性：通过对边界框回归样本的分析，得出以下结论：
- 当回归样本的偏差和形状偏差相同且不全为0时，假设GT框不是正方形且有长短边，边界框形状和尺度的差异会导致其IoU值的差异。
- 对于相同尺度的边界框回归样本，当回归样本的偏差和形状偏差相同且不全为0时，边界框的形状会对回归样本的IoU值产生影响。沿着边界框短边方向的偏差和形状偏差对应的IoU值变化更为显著。
- 对于具有相同形状边界框的回归样本，当回归样本偏差和形状偏差相同且不全为0时，与较大尺度的回归样本相比，较小尺度边界框回归样本的IoU值受GT框形状的影响更为显著。
Shape - IoU公式：
- $\frac{|B \cap B^{gt}|}{|B \cup B^{gt}|}$
- $\frac{2 \times (w^{gt})^{scale}}{(w^{gt})^{scale} + (h^{gt})^{scale}}$
- $\frac{2 \times (h^{gt})^{scale}}{(w^{gt})^{scale} + (h^{gt})^{scale}}$
- $distance^{shape} = hh \times (\frac{x_c - x_c^{gt}}{c})^{2} + ww \times (\frac{y_c - y_c^{gt}}{c})^{2}$
- $\Omega^{shape} = \sum_{t = w, h}(1 - e^{-\omega_t})^{\theta}, \theta = 4$ ，其中 $\left\{\begin{array}{l} \omega_{w} = hh \times \frac{|w - w^{gt}|}{max(w, w^{gt})} \\ \omega_{h} = ww \times \frac{|h - h^{gt}|}{max(h, h^{gt})} \end{array}\right.$
对应的边界框回归损失： $L_{Shape - IoU} = 1 - IoU + distance^{shape} + 0.5 \times \Omega^{shape}$

在这里插入图片描述

2.2 优势

提高检测性能：论文中通过一系列对比实验，证明了Shape-IoU方法在不同检测任务中能够有效提高检测性能，优于现有方法，在不同检测任务中达到了最先进的性能。
关注边界框自身属性：考虑了边界框本身的形状和尺度对边界框回归的影响，弥补了现有研究忽略这一因素的不足。
在小目标检测任务中的应用：针对小目标检测任务，提出了Shape-Dot Distance和Shape-NWD，将Shape-IoU的思想融入其中，提高了在小目标检测方面的性能。

论文：https://arxiv.org/pdf/2312.17663
源码：https://github.com/malagoutou/Shape-IoU

三、Shape-IoU的实现代码

Shape-IoU的实现代码如下：

def shape_iou(box1, box2, xywh=True, scale=0  eps=1e-7):(x1, y1, w1, h1), (x2, y2, w2, h2) = box1.chunk(4, -1), box2.chunk(4, -1)w1_, h1_, w2_, h2_ = w1 / 2, h1 / 2, w2 / 2, h2 / 2b1_x1, b1_x2, b1_y1, b1_y2 = x1 - w1_, x1 + w1_, y1 - h1_, y1 + h1_b2_x1, b2_x2, b2_y1, b2_y2 = x2 - w2_, x2 + w2_, y2 - h2_, y2 + h2_# Intersection areainter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \(torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0)# Union Areaunion = w1 * h1 + w2 * h2 - inter + eps# IoUiou = inter / union#Shape-Distance    #Shape-Distance    #Shape-Distance    #Shape-Distance    #Shape-Distance    #Shape-Distance    #Shape-Distance  ww = 2 * torch.pow(w2, scale) / (torch.pow(w2, scale) + torch.pow(h2, scale))hh = 2 * torch.pow(h2, scale) / (torch.pow(w2, scale) + torch.pow(h2, scale))cw = torch.max(b1_x2, b2_x2) - torch.min(b1_x1, b2_x1)  # convex widthch = torch.max(b1_y2, b2_y2) - torch.min(b1_y1, b2_y1)  # convex heightc2 = cw ** 2 + ch ** 2 + eps                            # convex diagonal squaredcenter_distance_x = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2) / 4center_distance_y = ((b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4center_distance = hh * center_distance_x + ww * center_distance_ydistance = center_distance / c2omiga_w = hh * torch.abs(w1 - w2) / torch.max(w1, w2)omiga_h = ww * torch.abs(h1 - h2) / torch.max(h1, h2)shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4)iou = iou - distance - 0.5 * ( shape_cost)return iou  # IoU

四、添加步骤

4.1 修改utils\metrics.py

此处需要查看的文件是utils\metrics.py

metrics.py中定义了模型的损失函数和计算方法，我们想要加入新的损失函数就只需要将代码放到这个文件内即可

Slide Loss添加后如下：

在这里插入图片描述

4.2 修改utils\loss_tal_dual.py

utils\loss_tal_dual.py是损失函数的辅助分支+主分支损失计算文件。

在utils\loss_tal_dual.py在的引用中添加shape_iou，然后在102行处修改成如下代码，使模型调用此Shape-IoU损失函数。

在这里插入图片描述


iou = shape_iou(pred_bboxes_pos, target_bboxes_pos)

在这里插入图片描述

此时再次训练模型便会使用Shape-IoU计算模型的损失函数。

查看全文

http://www.mrgr.cn/news/29400.html

C++入门基础（上）

？？Ansible——ad-hoc

活动系统开发之采用设计模式与非设计模式的区别-后台功能总结

函数题 6-9 统计个位数字【PAT】

建立这一新框架以应对人才紧缺时期的敏捷内容运营

论文速递 | 基于MIC-ICEEMD-RIME-DHKELM的碳排放预测模型研究

解决nginx代理SSE接口的响应没有流式返回

MUNIK谈ASPICE系列专题分享（一）什么是ASPICE？

农产品交易平台的设计与实现

该州允许AI帮助裁定失业申请

linux 内核代码学习（九）--Linux内核启动和文件系统

【工具】Java Excel转图片

基于SpringBoot的在线教育平台的设计与实现

高密原型验证系统解决方案（上篇）

【Elasticsearch系列十一】聚合 DSL API

html，css基础知识点笔记（二）

UE4_后期处理六—复古电视效果

RTX 4090 系列即将停产，RTX 5090 系列蓄势待发

uniapp 发布苹果IOS详细流程，包括苹果开发者公司账号申请、IOS证书、.p12证书文件等

上海人工智能实验室开源视频生成模型Vchitect 2.0 可生成20秒高清视频

一、本文介绍

文章目录

二、Shape-IoU设计原理

2.1 原理

2.2 优势

三、Shape-IoU的实现代码

四、添加步骤

4.1 修改utils\metrics.py

4.2 修改utils\loss_tal_dual.py

相关文章：