当前位置: 首页 > news >正文

正则化-权重衰减

若添加了正则化项,反向求梯度的时候也要对正则化项求导

当添加正则项,若正则项前面的参数过大,要想减小损失函数的值只能是w趋于0,w趋于0减少了神经网络中神经元的影响,相当于屏蔽了一些神经元,使网络变得简单

以激活函数tanh为例,z=xw+b,正则化参数大,w小,z就小,激活范围就在原点周围,类似于线性函数,无法表示复杂的决策函数,减轻了过拟合

另一种思维就是若将总的损失看作是损失和正则项的总和,想要总的损失最小,就需要在损失和正则项之间找到一个平衡,正则项限制了参数的取值范围,防止参数取值过大

计算梯度需要明白矩阵如何求导,求导这块也说明选用L2正则的原因,若选用L1范数,求导后该项只有一个常数,对于权重本身比较小的特征影响更大,被清为0的概率更大。

添加了L2正则的损失函数对权重求导,更新参数时,原始权重会先乘一个<1的数,此时权重衰减了。


http://www.mrgr.cn/news/53633.html

相关文章:

  • IIC通信与MAX30102采集血样数据+V4L2框架
  • 什么是全局污染?怎么避免全局污染?
  • Lua中的goto语句
  • 柯桥俄语学习,旅游俄语中的支付和交际常用语句
  • 光纤光学——弱导光纤与线偏振模
  • 数组算法(代码随想录)
  • Vue Google 广告的配置
  • 数据库原理与应用(基于MySQL):实验六数据查询
  • rpm 命令
  • PPT自动化:如何判断PPT中的shape类型(python-pptx中常见shape类型及其代码速查表)
  • 【学习笔记】理解 C++ 中 reinterpret_cast 和 C 风格类型转换的区别
  • 动态分层强化学习(DHRL)算法详解
  • 西门子嵌入式面试题及参考答案(万字长文)
  • 【SpringBoot系列】SpringBoot中集成日志的几种方式?
  • JavaWeb 开发指南
  • JavaWeb 23.一文速通npm的配置和使用
  • 【代码模板】如何用Python脚本执行shell命令并且获取命令的输出?(subprocess.Popen,subprocess.check_output)
  • TryHackMe 第8天 | Web Fundamentals (三)
  • 如何安全运行别人上传的Python代码?
  • 题目 3161: 蓝桥杯2023年第十四届省赛真题-子矩阵
  • kubernetes(三)
  • 勤于奋身体倒下还是上来回答粉丝关于Adsense赚美金
  • 设计模式之设计模式分类
  • ESP32-IDF 通用定时器 GPTimer
  • LeetCode题练习与总结:拼接最大数--321
  • 小白学大模型 RAG:GraphRAG 概念、组成和流程,看完这一篇你就懂了!!