当前位置：首页 > news >正文

深度学习：Yolo系列 V1和V2的对比

news 2024/10/22 22:08:04

YOLO V1和V2的对比：

BatchNorm

V2版本舍弃dropout，卷积后全部加入batch normalization网络的每一层的输入都做了归一化，收敛相对更容易，经过batch normalization处理后的网络会提升2%的map，从现在的角度来看，batch normalization已经成为网络必备处理

更大的分辨率

V1训练时用的是224*224，测试时使用448*448可能导致模型水土不服，V2训练时额外又进行了10次448*448的微调，使用高分辨分类器后，Yolo- v2的map提升了约4%

网络结构

darknet，实际输入为416*416，没有fc层，5次降采样（13*13），1*1卷积节省了很多参数

聚类提取先验框

faster-rcnn系列的先验比例都是常规的，但是不一定完全适合数据集，k-means聚类中的距离：d=1-lou

anchor box

通过引入anchor boxes,使得预测的box数量更多（13*13*n），跟faster-rcnn系列不同的是先验框并不是直接按照长宽固定比给定

Directed Location Prediction

其目的是进行位置微调，预测偏移量。它用于限制偏移量，以防止在训练时出现发散。这种方法预测的是相对位置，即相对于网格的偏移量。

感受野

概述来说就是特征图上的点能看到原始图像多大区域

fine-grainde features

最后一层是感受野太大了，小目标可能丢失了，需要融合之前的特征

Multi-Scale

整个网络结构不包含全连接层，因此输入图片的大小可以任意最小的图像尺寸为320*320 最大的图像尺寸为608*608

查看全文

http://www.mrgr.cn/news/56271.html

【人工智能】Transformers之Pipeline（二十）：令牌分类（token-classification）

leetcode day1 910+16

【ArcGIS Pro实操第五期】全局及局部空间插值：GPI、LPI、IDW等

提取图片内容的 Python 程序

autMan框架对接飞书机器人

1. 路由定义

Point2CAD: Reverse Engineering CAD Models from 3D Point Clouds 论文阅读

【C++】用哈希桶模拟实现unordered_set和unordered_map

【大模型】一个简单程序看透 RAG 的核心原理，理解优化 RAG 的关键要点

Redission分布式锁详解

YOLO目标检测理论详解，YOLOv1理论知识讲解，超w字精读（学习YOLO框架必备），全网最详细教程

嵌入式 MCU 编程提速秘籍 —— 让你的程序飞起来！

书生实战营第四期-第一关Linux+InternStudio

肉桂酰辅酶A还原酶Cinnamoyl-CoA Reductases（CCR）表征及晶体-文献精读70

0基础学java之Day12

二分查找_在排序数组中查找元素的第一个和最后一个位置

超详细JDK安装+环境配置教程

vnc+wsl2试用

深入浅出剖析重量级文生图模型Flux.1

数据结构图的应用最小生成树-普里姆算法(C语言代码+无向网+有向网+邻接矩阵存储结构)-最低附带图片+终端输入内容方便理解

【Python爬虫系列】_031.Scrapy_模拟登陆中间件

让你的 IDEA 使用更流畅 | IDEA内存修改