当前位置：首页 > news >正文

正则化-权重衰减

news 2024/10/23 11:20:37

若添加了正则化项，反向求梯度的时候也要对正则化项求导

当添加正则项，若正则项前面的参数过大，要想减小损失函数的值只能是w趋于0，w趋于0减少了神经网络中神经元的影响，相当于屏蔽了一些神经元，使网络变得简单

以激活函数tanh为例，z=xw+b,正则化参数大，w小，z就小，激活范围就在原点周围，类似于线性函数，无法表示复杂的决策函数，减轻了过拟合

另一种思维就是若将总的损失看作是损失和正则项的总和，想要总的损失最小，就需要在损失和正则项之间找到一个平衡，正则项限制了参数的取值范围，防止参数取值过大

计算梯度需要明白矩阵如何求导，求导这块也说明选用L2正则的原因，若选用L1范数，求导后该项只有一个常数，对于权重本身比较小的特征影响更大，被清为0的概率更大。

添加了L2正则的损失函数对权重求导，更新参数时，原始权重会先乘一个<1的数，此时权重衰减了。

http://www.mrgr.cn/news/53633.html

相关文章：

IIC通信与MAX30102采集血样数据+V4L2框架

什么是全局污染?怎么避免全局污染?

Lua中的goto语句

柯桥俄语学习，旅游俄语中的支付和交际常用语句

光纤光学——弱导光纤与线偏振模

数组算法（代码随想录）

Vue Google 广告的配置

数据库原理与应用（基于MySQL）：实验六数据查询

PPT自动化：如何判断PPT中的shape类型（python-pptx中常见shape类型及其代码速查表）

【学习笔记】理解 C++ 中 reinterpret_cast 和 C 风格类型转换的区别

动态分层强化学习（DHRL）算法详解

西门子嵌入式面试题及参考答案（万字长文）

【SpringBoot系列】SpringBoot中集成日志的几种方式?

JavaWeb 开发指南

JavaWeb 23.一文速通npm的配置和使用

【代码模板】如何用Python脚本执行shell命令并且获取命令的输出？(subprocess.Popen，subprocess.check_output)

TryHackMe 第8天 | Web Fundamentals (三)

如何安全运行别人上传的Python代码？

题目 3161: 蓝桥杯2023年第十四届省赛真题-子矩阵

kubernetes（三）

勤于奋身体倒下还是上来回答粉丝关于Adsense赚美金

设计模式之设计模式分类

ESP32-IDF 通用定时器 GPTimer

LeetCode题练习与总结：拼接最大数--321

小白学大模型 RAG：GraphRAG 概念、组成和流程，看完这一篇你就懂了！！