当前位置: 首页 > news >正文

LSTM结构原理

什么是LSTM

LSTM(长短时记忆)网络是一种特殊的RNN网络,通过门结构,对细胞状态进行删除或者添加信息。门能够选择性的决定让哪些信息通过,其中们结构通过sigmoid曾和一个点乘操作来实现。
LSTM能够处理文本数据或者时序数据。

LSTM 解决了什么问题

LSTM的门结构能够选择性的记忆或者忘记信息,有效避免了梯度消失问题,并保持了长期记忆的能力。

LSTM的实现原理

门的实现

通过Sigmoid层和一个点乘操作的组合,sigmoid函数输出的结构在0-1之间。
在这里插入图片描述

1、遗忘门(forget gate)

遗忘门f:决定遗忘多少前一时刻的记忆
为一个向量(与h 、c有相同的维度)。

  • C表示长期记忆
  • h(t-1)表示上一时刻网络状态,h(t)表示当前时刻网络状态;
    遗忘门的权重和当前时刻的状态输入xt拼接上一个时刻的网络状态h(t-1)相乘,再经过sigmoid函数得到ft(值为0-1之间)
    在这里插入图片描述

2、输入门(input gate)

输入门:决定要记住多少当前输入信息,同时结合遗忘门的输出,计算出新的记忆单元状态。
在这里插入图片描述
Ct^表示短时记忆
在这里插入图片描述

更新Ct

通过遗忘门和输入门的向量更新Ct
在这里插入图片描述

3、输出门(output gate)

输出门:决定哪些值流出
在这里插入图片描述

更新输出

状态ht:LSTM的输出,通过ot计算多少长期记忆用于LSTM的输出。
在这里插入图片描述

整体流程

在这里插入图片描述
LSTM结构中包含:遗忘门、输入门、输出门。图中上方的传输带传递的是长期记忆。

  • 遗忘门计算当前输入向量xt与前一时刻的记忆向量h(t-1)拼接的向量与遗忘门权重向量wf相乘,经过sigmoid激活函数得到ft向量。根据上一个时刻的输出与当前时刻的输入选择需要在单元状态中遗忘的状态。
  • 输入门计算两部分信息,第一部分记住多少当前输入信息,第二部分计算遗忘门输出的信息,结合两部分计算新的记忆单元。根据上一个状态输出和当前输入选择需要在单元状态中新记忆的状态。
  • 输出门计算记忆单元中多少内容作为LSTM 的输出。根据单元状态和当前输入决定LSTM的输出

遗忘门、输入门、输出门中输入门包含两个参数,其他门各包含一个参数。维度是(h, h+x)


感谢:
https://www.bilibili.com/video/BV1i44y1P7J5?spm_id_from=333.788.player.switch&vd_source=91cfed371d5491e2973d221d250b54ae


http://www.mrgr.cn/news/67123.html

相关文章:

  • SpringBoot day 1105
  • InsCode线上IDE推荐及使用指南
  • 数据迁移: 安全高效转移数据, 满足企业业务需求和技术改进
  • 笔尖与灵魂的对话:写作,习惯之花绽放
  • 关于Linux系统调试和性能优化技巧有哪些?
  • ORACLE 删除archivelog日志
  • 自动化测试中使用Pytest Fixture?推荐10种常见用法!
  • 【k8s】ClusterIP能http访问,但是不能ping 的原因
  • SpringAI QuickStart
  • C++练习题(2)
  • 2024亚太杯数学建模思路+代码+模型预定(更新见文末名片)
  • C语言---程序设计基础练习题目3
  • 修改elementUI等UI组件样式的5种方法总结,哪些情况需要使用/deep/, :deep()等方式来穿透方法大全
  • 【系统分析师】-案例-综合知识大全
  • 【AI换装整合包及教程】OOTDiffusion: AI换装工具的革命性创新
  • PAT 甲级 1076 Forwards on Weibo(30)
  • SparkSql输出数据的方式
  • 代码要走的路:编程“三部曲”
  • 基于Multisim光控夜灯LED电路(含仿真和报告)
  • 基于STM32的八位数码管显示Proteus仿真设计
  • ubuntu中安装matplotcpp绘图
  • web端div带地图导出png图片功能
  • [LitCTF 2023]ez_XOR
  • 第十九课 Vue组件中的方法
  • 驱动-----dht11温湿度传感器
  • 《XGBoost算法的原理推导》12-7损失函数经验损失项二阶泰勒展开式 公式解析