当前位置: 首页 > news >正文

论文阅读【时间序列】ModerTCN (ICLR2024)

【时间序列】ModerTCN (ICLR2024)

原文链接:ModernTCN: A Modern Pure Convolution Structure for General Time Series Analysis
代码仓库:ModerTCN
简易版本实现代码可以参考:(2024 ICLR)ModernTCN:A Modern Pure Convolution Structure for General Time Series Analysis

在这里插入图片描述
本文提出ModerTCN模块,以平衡时间序列任务中的效率与效果。

背景

Transformer Block

self-attention 模块:
在这里插入图片描述
其中Q,K,V来自与输入x与可学习参数的乘积。
FFN模块:通常为若干线性层和激活函数的组合

Modern Convolution Block

Modern Convolution Block是Depthwise convolution和Pointwise convolution的结合,这两种卷积模块是的讲解详情见【轻量化网络系列(1)】MobileNetV1论文超详细解读(翻译 +学习笔记+代码实现)。

在这里插入图片描述
传统卷积模块的卷积核是D * D * M的,其中M是通道数量,卷积后的结果也是一个由M个通道组成的三维特征方阵。

Depthwise卷积是将卷积核缩减到D * D * 1,每个卷积核只用于一个通道的特征提取,得到一个二维的特征方阵。而M个通道分别用不同的卷积核进行卷积,最终由M个通道分别卷积,再将M个通道整合在一起。

Pointwise卷积则是对不同通道的整合,即使用1 * 1 * M的卷积核,将M个通道的融合起来。

ModernTCN

在这里插入图片描述
M: 变量数, L: 序列长度
模型主要结构包含一个DWConv核两个ConvFFN,其中每个ConvFFN由两个PWConv组成。
官方仓库中的代码不利于理解,简易版本实现代码可以参考:(2024 ICLR)ModernTCN:A Modern Pure Convolution Structure for General Time Series Analysis

DWConv主要任务是混合时域信息,即对N这一维度进行卷积。
两个ConvFFN分别是对M和D维度进行卷积,先后混合通道和维度信息。
至此,通过若干CNN层,完成全部信息融合与交互。
在这里插入图片描述


http://www.mrgr.cn/news/35386.html

相关文章:

  • 如何使用 WebAssembly 扩展后端应用
  • Move开发语言在区块链的开发与应用
  • [OpenGL]使用OpenGL实现硬阴影效果
  • Openshift 如何更新访问控制机
  • Python自动化运维DevSecOps与安全自动化
  • 升级浏览器
  • YOLOv8——测量高速公路上汽车的速度
  • consul注册中心与容器自动发现实战
  • 报表做着太费劲?为你介绍四款好用的免费报表工具
  • 2k1000LA 调试HDMI
  • 深度学习|误差逆传播:梯度速解
  • 力扣算法题总结
  • CVPR最牛图像评价算法!
  • 基于jsonpath的JSON数据查找
  • 【深度】边缘计算神器之数据网关
  • 如何选择游戏高防服务器,有什么需要注意的点?
  • 14.第二阶段x86游戏实战2-C++语言开发环境搭建-VisualStudio2017
  • 【工具】语音朗读PDF的免费工具
  • 《程序猿之设计模式实战 · 适配器模式》
  • 【软件测试】详解测试中常用的几种测试方法
  • 图文组合商标部分驳回后优化后初审通过!
  • C++类和对象(中)【下篇】
  • 使用chatglm3-6b来帮助我们构建菜谱数据集
  • 华为驱动未卸载导致内存完整性无法开启,导致lol卡顿,后台十几个重复进程
  • [万字长文]stable diffusion代码阅读笔记
  • 详解 C++中的模板