当前位置: 首页 > news >正文

YOLOv8模型改进 第十六讲 添加频率谱动态聚合模块FSDA 去除图像噪声

           在图像去雾领域,深度学习在白天图像去雾方面已取得显著成果,但夜间雾图研究较少。夜间雾图面临雾、辉光和噪声等复杂干扰,且模拟数据与真实数据的亮度差异也带来挑战。为解决这些问题,我们使用FSDA模块,处理频率不一致特性。FSDA首先聚合频谱信息,再计算并应用通道权重,最后映射回空间域,从而优化频谱信息,增强YOLOv8在去噪中的能力

 1. 频率谱动态聚合模块FSDA介绍   

  1.  频谱信息聚合:首先,以特征图的幅度谱和相位谱作为输入。对其进行逐点卷积操作,然后经过激活函数处理,实现频谱信息的初步聚合。
  2. 计算通道权重:接着,以聚合后的频谱信息为输入。先进行全局平均池化,再经过多次卷积和激活函数操作,最后通过特定激活函数得到通道权重映射。
  3. 应用通道权重:之后,将通道权重映射与之前聚合的频谱信息进行点乘,再通过卷积操作,然后利用残差连接进行滤波,从而得到滤波后的频谱信息,包括幅度谱和相位谱。
  4. 映射回空间域:最后,根据滤波后的幅度谱和相位谱计算出实部和虚部,再通过傅里叶逆变换将特征图重新映射回空间域。

 2. 接下来,我们将详细介绍如何将FSDA集成到 YOLOv8 模型中。        

这是我的GitHub代码:tgf123/YOLOv8_improve (github.com)

这是改进讲解:YOLOv8模型改进 第十六讲 添加频率谱动态聚合模块FSDA 去除图像噪声_哔哩哔哩_bilibili

2.1  如何添加

        1. 首先,在我上传的代码中yolov8_improve中找到FSDA.py代码部分,它包含两个部分一个是FSDA.py的核心代码,一个是yolov8模型的配置文件。 

       

        2. 然后我们在modules文件夹下面创建FSDA.py文件,然后将FSDA的核心代码放入其中

    3. 在 task.py文件中导入FSDA

from ultralytics.nn.modules.FSDA import C2f_FSDA

     4. 然后将 FSDA添加到下面当中

        

        5. 最后将配置文件复制到下面文件夹下

        6. 运行代码跑通 


from ultralytics.models import NAS, RTDETR, SAM, YOLO, FastSAM, YOLOWorldif __name__=="__main__":# 使用自己的YOLOv8.yamy文件搭建模型并加载预训练权重训练模型model = YOLO(r"D:\bilibili\model\ultralytics-main\ultralytics\cfg\models\v8\yolov8_FSDA.yaml")\.load(r'D:\bilibili\model\ultralytics-main\tests\yolov8n.pt')  # build from YAML and transfer weightsresults = model.train(data=r'D:\bilibili\model\ultralytics-main\ultralytics\cfg\datasets\VOC_my.yaml',epochs=100, imgsz=640, batch=8, amp=False)
# self.args.half = False 关闭半精度验证


http://www.mrgr.cn/news/61720.html

相关文章:

  • 如何选择适合自己的 Python IDE
  • linux与windows绑定nas命令
  • LeetCode Hot 100:技巧
  • 快速在本地运行SpringBoot项目的流程介绍
  • Vscode 启动 Java 项目笔记
  • Linux基础环境搭建(CentOS7)- 安装Scala和Spark
  • spring boot 3.x 整合Swagger3
  • 【传知代码】知识图谱推理(论文复现)
  • 利用大语言模型实现模拟版图自动化
  • 认知战认知作战:顺治帝迁都北京的认知作战分析与策略
  • 预告帖|在MATLAB/Simulink中调用C语言的几种方法
  • 查询windows或者linux上 支持的所有字体
  • Kubeadm搭建k8s
  • 直播带货视频素材网站推荐
  • 跟着小土堆学习pytorch(五)——dataloader
  • Java爬虫的京东“寻宝记”:揭秘商品类目信息
  • vue打包的dist文件,再使用eletron打包为exe
  • GitHub Copilot 转型采用多模型策略,支持 Claude 3.5 和 Gemini
  • Cesium中遇到 materialProperty.getType is not a function
  • 2024 FinTechathon 校园行:助力高校学生探索金融科技创新
  • PHP爬虫的奇幻之旅:如何用代码“偷窥”京东商品的SKU信息
  • 使用Python实现一个简单的HTTP服务器:返回当前时间
  • 【机器学习】音乐与AI的交响:机器学习在音乐产业中的应用
  • Ubuntu 20.04 安装 OpenCV 和 OpenCV_contrib 教程
  • CodeS:构建用于文本到 SQL 的开源语言模型
  • 戴尔 Inspiron 14 5418 (11代)安装win10 ltsc lot 企业版