当前位置: 首页 > news >正文

深度学习:Yolo系列 V1和V2的对比

YOLO V1和V2的对比:

BatchNorm

V2版本舍弃dropout,卷积后全部加入batch normalization网络的每一层的输入都做了归一化,收敛相对更容易,经过batch normalization处理后的网络会提升2%的map,从现在的角度来看,batch normalization已经成为网络必备处理

更大的分辨率

V1训练时用的是224*224,测试时使用448*448可能导致模型水土不服,V2训练时额外又进行了10次448*448的微调,使用高分辨分类器后,Yolo- v2的map提升了约4%

网络结构

darknet,实际输入为416*416,没有fc层,5次降采样(13*13),1*1卷积节省了很多参数

聚类提取先验框

faster-rcnn系列的先验比例都是常规的,但是不一定完全适合数据集,k-means聚类中的距离:d=1-lou

anchor box

通过引入anchor boxes,使得预测的box数量更多(13*13*n),跟faster-rcnn系列不同的是先验框并不是直接按照长宽固定比给定

Directed Location Prediction

其目的是进行位置微调,预测偏移量。它用于限制偏移量,以防止在训练时出现发散。这种方法预测的是相对位置,即相对于网格的偏移量。

感受野

概述来说就是特征图上的点能看到原始图像多大区域

fine-grainde features

最后一层是感受野太大了,小目标可能丢失了,需要融合之前的特征

Multi-Scale

整个网络结构不包含全连接层,因此输入图片的大小可以任意 最小的图像尺寸为320*320 最大的图像尺寸为608*608


http://www.mrgr.cn/news/56271.html

相关文章:

  • 【人工智能】Transformers之Pipeline(二十):令牌分类(token-classification)
  • leetcode day1 910+16
  • 【ArcGIS Pro实操第五期】全局及局部空间插值:GPI、LPI、IDW等
  • 提取图片内容的 Python 程序
  • autMan框架对接飞书机器人
  • 1. 路由定义
  • Point2CAD: Reverse Engineering CAD Models from 3D Point Clouds 论文阅读
  • 【C++】用哈希桶模拟实现unordered_set和unordered_map
  • 【大模型】一个简单程序看透 RAG 的核心原理,理解优化 RAG 的关键要点
  • Redission分布式锁详解
  • YOLO目标检测理论详解,YOLOv1理论知识讲解,超w字精读(学习YOLO框架必备),全网最详细教程
  • 嵌入式 MCU 编程提速秘籍 —— 让你的程序飞起来!
  • 书生实战营第四期-第一关Linux+InternStudio
  • 肉桂酰辅酶A还原酶Cinnamoyl-CoA Reductases(CCR)表征及晶体-文献精读70
  • 0基础学java之Day12
  • 二分查找_在排序数组中查找元素的第一个和最后一个位置
  • 超详细JDK安装+环境配置教程
  • vnc+wsl2试用
  • 深入浅出剖析重量级文生图模型Flux.1
  • 数据结构图的应用最小生成树-普里姆算法(C语言代码+无向网+有向网+邻接矩阵存储结构)-最低附带图片+终端输入内容方便理解
  • 【Python爬虫系列】_031.Scrapy_模拟登陆中间件
  • 让你的 IDEA 使用更流畅 | IDEA内存修改
  • 常见的加密算法的分类及其原理
  • 利用自定义 ref 实现函数防抖
  • 批量合并同名Labelme标注文件内容
  • freeRTOS中互斥锁与信号量使用?