当前位置: 首页 > news >正文

机器学习算法那些事 | TPAMI 2024.9 | FeatAug-DETR:通过特征增强丰富DETRs的一对多匹配

本文来源公众号“机器学习算法那些事”,仅用于学术分享,侵权删,干货满满。

原文链接:TPAMI 2024.9 | FeatAug-DETR:通过特征增强丰富DETRs的一对多匹配

论文标题:FeatAug-DETR: Enriching One-to-Many Matching for DETRs With Feature Augmentation

论文链接:https://ieeexplore.ieee.org/document/10480276

这篇论文提出了一种新方法,通过增强特征(而不仅仅是图像数据)来提升DETR(检测转换器)在目标检测任务中的性能。论文的主要贡献包括:

  • 一对多匹配的创新:DETR原本采用一对一匹配策略,这虽然避免了非极大值抑制(NMS)步骤,但导致正样本监督稀疏,进而训练收敛速度较慢。为了解决这个问题,本文提出通过数据增强(DataAug-DETR)和特征增强(FeatAug-DETR)来实现一对多匹配,从而加速训练并提升检测精度。

  • 特征增强(FeatAug-DETR):通过在特征层进行增强操作(如翻转、裁剪等),而不是在图像层进行操作,减少了重复输入不同版本的图像所带来的计算开销。这种增强方式不仅提高了模型的训练效率,还保持了推理阶段的速度不变。

本文通过特征增强策略提出了一种更高效的一对多匹配机制,相较于传统方法,FeatAug-DETR在减少计算量的同时大幅提升了DETR的训练速度和检测效果。这种方法易于集成到现有的DETR架构中,并在多个任务中表现出色。

1. 现有方法与论文方法对比

下图上部分的流程图表示DETR现有的一对多匹配方法。

现有方法通过增加额外的目标查询(object queries)来实现一对多匹配。每个真实物体会被多个不同的查询匹配,生成多个预测结果。这些方法通过多组查询来提升正样本的监督,进而加快训练速度。

问题:这种方法需要引入额外的目标查询,增加了计算成本。

image-20240919220004081

下半部分的流程图表示特征增强的DETR。

FeatAug-DETR采用了一种更高效的方式,不是直接增强图像,而是增强特征图。这种方法通过对特征图进行空间变换(如翻转或裁剪)生成多个增强特征版本,并在同一个批次中处理它们,从而实现一对多匹配。

优点:FeatAug-DETR比DataAug-DETR更高效,因为它只需要在模型中运行一次图像,通过增强特征而不是图像,减少了重复处理不同版本图像的计算开销。

2. DataAug-DETRFeatAug-DETR的工作流程

image-20240919220639043

上图展示了DataAug-DETRFeatAug-DETR的工作流程,详细说明了这两种方法如何通过数据增强或特征增强来实现一对多匹配,从而提升DETR模型的性能。

(a) DataAug-DETR

  • 图像增强过程:DataAug-DETR首先对输入图像进行多次空间增强操作(例如翻转和裁剪),生成多个增强版本的图像。在同一个训练批次中,多个增强后的图像会被一起输入到模型中。

  • 特征提取:这些增强后的图像经过视觉骨干网络(vision backbone)处理,生成对应的特征图。

  • 匹配与训练:通过在不同增强图像上分配不同的目标查询,模型实现了一对多的匹配。这种方法有效地增加了正样本监督,从而加快了模型训练速度,并提升了检测精度。

(b) FeatAug-DETR

  • 特征增强过程:与DataAug-DETR不同,FeatAug-DETR不是对图像进行增强,而是直接对视觉骨干网络输出的特征图进行增强。这种增强包括对特征图进行空间变换(例如翻转或裁剪),从而生成多个增强的特征图版本。

  • 特征多样性:每个增强后的特征图都包含不同的空间信息,这使得目标查询可以与不同的特征区域进行匹配,进而实现一对多匹配。

  • 高效性:FeatAug-DETR相比DataAug-DETR更加高效,因为它仅需要在视觉骨干网络中处理一次图像,避免了多次输入增强图像所带来的计算负担。

这两种方法在目标检测任务重实现更好的正样本监督和更快的收敛速度。

3.实验对比

如下图表,图像增强和特征增强,在多个DETR变体中都取得了显著的性能提升。相比于传统的一对一匹配方法,通过特征增强实现的一对多匹配既加快了模型的收敛速度,又提高了检测精度。与DataAug-DETR相比,FeatAug-DETR具有更高的效率。DataAug-DETR虽然也能提升模型性能,但由于其对图像的多次增强处理,计算开销较大。而FeatAug-DETR通过对特征图的增强,减少了计算量,同时保持了较高的检测精度。

image-20240919221650348

THE END !

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。


http://www.mrgr.cn/news/33550.html

相关文章:

  • Day44 | 动态规划 :状态机DP 买卖股票的最佳时机IV买卖股票的最佳时机III
  • caozha-whois(域名Whois查询源码)
  • HTTP常见的请求头有哪些?都有什么作用?在 Web 应用中使用这些请求头?
  • 【leetcode练习·二叉树】用「分解问题」思维解题 II
  • ★ 算法OJ题 ★ 前缀和算法(下)
  • 第七部分:2. STM32之ADC实验--AD多通道(AD采集三路传感器模块实验:光敏传感器、热敏传感器、反射式传感器附赠温湿度传感器教程)
  • 【人工智能】在大型活动中的应用案例
  • 带你0到1之QT编程:十七、Http协议实战,实现一个简单服务器和一个客户端进行http协议通信
  • Python 虚拟环境安装使用(Anaconda 完整实操版)
  • stable diffusion 神经网络插件 controlnet 的安装,很详细
  • 自学笔记之TVM编译器框架 ,核心特性,模型优化概述,AI应用落地
  • 【C++初阶】模版进阶
  • 6、论文阅读:水下图像增强基准数据集及其他数据集
  • go语言 swagger 查询 json 字段注释
  • REST-系统架构师(六十九)
  • mysql配置相关命令
  • 设计模式之策略模式例题
  • 【HTTPS】对称加密和非对称加密
  • 【设计模式】万字详解:深入掌握五大基础行为模式
  • 存储系统概述
  • 【动态库的加载】【进程地址空间(三)】
  • 828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务
  • 如何让程序等待输入
  • Redis数据结构之zset
  • 20240922 每日AI必读资讯
  • Jboss 低版本JMX Console未授权