当前位置: 首页 > news >正文

NVIDIA cuDNN

英伟达™

文章目录

  • 前言
  • 一、Key Features 主要特点
    • 1. 加速学习
    • 2. 富有表现力的操作图 API
    • 3. 支持
  • 二、深度神经网络
  • 三、特征
  • 四、cuDNN 图形 API 和融合
  • 五、Key Features 主要特点
  • 六、 cuDNN 加速框架
  • 相关库和软件

在这里插入图片描述
在这里插入图片描述


前言

NVIDIA CUDA® 深度神经网络库 (cuDNN) 是一个用于深度神经网络的 GPU 加速基元库。cuDNN 为标准例程(如前向和后向卷积、注意力、matmul、池化和规范化)提供高度优化的实现。


在这里插入图片描述

一、Key Features 主要特点

1. 加速学习

cuDNN 提供针对 Tensor Core 的内核,以在计算绑定操作上提供最佳可用性能。它提供了启发式方法,用于为给定的问题大小选择正确的内核。

2. 富有表现力的操作图 API

用户将计算定义为张量运算图。为方便起见,cuDNN 库同时具有直接 C API 和开源 C++ 前端。大多数用户选择前端作为 cuDNN 的入口点。

3. 支持

cuDNN 支持计算绑定和内存绑定操作的融合。常见的通用融合模式通常由


http://www.mrgr.cn/news/54369.html

相关文章:

  • RabbitMQ最新版本4.0.2在Windows下的安装及使用
  • VScode远程服务器之远程容器进行开发(四)
  • 【微信小程序_19_自定义组件(1)】
  • java计算两个日期之间相差几天(小时、天)小时计算
  • 请解读下面的程序:pat =re.compile(r‘\d+‘)res = pat.search(‘www.ddd996.com‘)res.group()
  • 爬虫python=豆瓣Top250电影
  • SpringCloud学习:Seata总结与回顾
  • Qt开发技巧(十七):新窗口控件用智能指针,将一些配置类变量封装起来,Qt窗体的Z序叠放,子窗体的释放,Qt中的事件发送,Qt的全局头文件
  • 二、见招拆招:ShardingJDBC分库分表实战指南
  • springboot物流网站-计算机毕业设计源码90281
  • AI 通俗理解强人工智能和弱人工智能
  • 数据结构8—树(链式存储二叉树)
  • 组流技术与流特征分析
  • 软考(网工)——网络规划设计
  • ICM20948 DMP代码详解(90)
  • 什么是 Idempotence 以及它在哪里使用?
  • Windows 11开发环境搭建与应用开发实践
  • lesson01 Backtrader是什么
  • Rust虚拟机Demo
  • Vue基础(四)
  • 树莓派设置中文界面
  • Cisco Secure Network Analytics 7.5.1 发布下载,新增功能概览
  • PostgreSQL数据库存储结构
  • 白平衡之 White Patch 优化
  • 2024软考网络工程师笔记 - 第11章.网络管理
  • 深入理解WebSocket协议原理、实现与应用