当前位置: 首页 > news >正文

【目标跟踪综述及关键技术】

1.多目标跟踪任务介绍

定义

多目标跟踪旨在将视频序列中感兴趣的目标检测出来,并赋予每个目标单独的编号,在整个序列中形成目标的轨迹。

分类

online:算法在推理目标身份过程中,只能看见当前帧以及之前的帧(关联)
offline:算法在推理目标身份过程中,可以看见整个视频序列(最优化)

多目标跟踪VS检测

检测:给出图像中多个目标的类别与位置;
多目标跟踪:给出多个图像中多个目标的类别与位置,并与之前帧的轨迹进行数据关联

难点分析

1.目标模拟、遮挡造成的目标外观特征不稳定
2.相机运动等造成的外观特征与运动特征变化
3.各类别样本数量不均衡,分类器难以训练
4.目标尺寸小容易造成漏检
5.实时性要求

2.数据集与评价指标发展历程

多数被跟踪轨迹(Mostly Tracked trajectories,MT)

        真实轨迹中在大于等于80%的帧中被正确追踪的数目。有时也用百分比表示,越大越好。

多数丢失轨迹(Mostly Lost trajectories,ML)

         真实轨迹中在小于等于20%的帧中被正确追踪的数目。有时也用百分比表示,越小越好。

ID切换数(ID Switches,IDS)

        ID错误切换的次数。越小越好

MOTA、MOTP、IDP(精度)、IDR(召回率)、IDF1(分数)

HOTA、DetA、AssA

3.主要流派介绍

online形式的MOT算法,按照是否同时单次进行检测与轨迹处理可分为检测后跟踪(tracking by detection,TBD)与联合检测跟踪(joint detection and tracking,JDT)两种结构。

检测后跟踪,研究重点在于:特征提取方式、匹配策略。

联合检测跟踪,研究重点在于:共享网络设计、匹配策略

改进kalman滤波:

算法1:OCSORT
主要思想:inactive的轨迹要恢复时,为这个轨迹建立一个虚拟轨迹,修正kalman的误差。

算法2:BoT-SORT
主要思想:提取两帧之间关键点建立仿射矩阵,将Kalman滤波预测结果映射到新坐标下。

改进外观特征提取网络:

算法3:QDTrack
主要思想:产生大量的region proposal,利用对比学习的方式在关键帧和相邻帧之前来学习实例之间的相似性。

算法4:FairMOT
主要思想:将外观学习与目标检测合为一体,通过使用anchor-free的方式缓解两任务不平衡的问题。

算法5:UTrack
主要思想:采用无监督学习训练特征提取网络,定义两种约束条件:1.强约束:同一帧的目标之间不可以相互匹配 2.弱约束:两帧之间有多个重复目标,因此一帧里的目标大概率在另一帧中找到匹配。

融合其他特征

(1)融合空间拓扑关系
算法6:GSM
主要思想:采用GNN加入拓扑关系,对每个顶点都构建一个有向图,顶点表示外观特征,边表示位置关系特征,随后计算两帧间的每个目标的图相似度来进行匹配。

算法7:SGT
主要思想:采用GNN加入拓扑关系,顶点代表检测,边代表两个检测之间的相似度(IoU、拓扑关系、外观三个维度衡量),把两个检测是否属于同一目标转变为分类问题。

算法8:STLC
主要思想:利用局部相关模块对目标和周围的环境进行拓扑关系的建模,这样在拥挤场景有效。具体的,建立每个空间位置和其上下文的密集联系,然后通过自监督学习显式进行约束。

4.未来发展趋势

.5.学习资源总结


http://www.mrgr.cn/news/81389.html

相关文章:

  • 【蓝桥杯——物联网设计与开发】基础模块8 - RTC
  • 如何借助边缘智能网关实现厂区粉尘智能监测告警
  • 2025考研加油!Jing也加油哦!
  • Zookeeper基本命令解析
  • CTFHUB 历年真题 afr-1
  • JVM系列(十三) -常用调优工具介绍
  • 重温设计模式--2、设计模式七大原则
  • 人工智能ACA(六)--计算机视觉基础
  • js版本之ES6特性简述【Proxy、Reflect、Iterator、Generator】(五)
  • 时钟芯片入门指南:从原理到实践
  • 消息队列(一)消息队列的工作流程
  • 【老白学 Java】HashMap 的基本使用
  • 项目代码第6讲:UpdownController.cs;理解 工艺/工序 流程、机台信息;前端的“历史 警报/工艺 记录”;每个机台各个管道的数据(温度、压力、气体)
  • 【python】银行客户流失预测预处理部分,独热编码·标签编码·数据离散化处理·数据筛选·数据分割
  • postman http请求正常,使用前端代理服务器报403
  • 使用Qwen2-VL模型批量标注图像内容(图像理解)
  • YOLOv11模型改进-模块-引入多尺度大核注意力Multi-scale Large Kernel Attention
  • 【阅读记录-章节6】Build a Large Language Model (From Scratch)
  • 机器学习2-NumPy
  • 使用RabbitMQ
  • ABAP开发-权限控制
  • I.MX6U 启动方式详解
  • 解读1:TwinLiteNet论文中基础模块及其他相关模块总结
  • Centos7.9安装openldap+phpldapadmin+grafana配置LDAP登录最详细步骤 亲测100%能行
  • 基于ceres优化的3d激光雷达开源算法
  • EMS从0到1之数据采集