当前位置: 首页 > news >正文

GPU — 8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术

目录

文章目录

  • 目录
  • 8 卡 GPU 服务器
  • GPU 互联技术分类
  • PCIe 直连
  • PCIe Switch 互联
  • NVLink 互联
    • NVLink 1.0 与 DGX-1 系统
    • NVLink 2.0 与 DGX-1 系统
  • NVSwitch 全互联
    • NVSwitch 1.0 与 DGX-2 系统
    • NVLink 3.0、NVSwitch 2.0 与 DGX A100
    • NVLink 4.0、NVSwitch 3.0 与 DGX H100
  • GPU 互联拓扑类型总结
  • GPU 互联拓扑的带宽性能问题
  • NVSwitch v.s. PCIe Switch

8 卡 GPU 服务器

随着模型复杂程度增加,单张 GPU 无法完成训练任务,需要联合多张 GPU,尤其在 LLM 时代,8 卡 GPU 服务器已经成为了新的常态。

在 8 卡 GPU 服务器中,CPU 仍然承担着系统管理、任务调度、逻辑运算等工作,而 GPU 则主要负责大规模并行计算任务。

在这里插入图片描述

GPU 互联技术分类

在深度学习的训练过程中,随着 GPU 算力的飞速飙升,GPU 之间的互联数据传输速度已经成为了制约训练效率的瓶颈。从网络构成的角度,可以分为:

  1. GPU 卡间互联
  2. GPU 服务器件互联

本文讨论的是单机 GPU 卡间互联。解决的问题就是如何将 8 张 GPU 互联起来,使其能够互相进行高效的通信。从互联技术的层面有以下 4 大类:

  1. PCIe 直连
  2. PCIe Switch 互联
  3. NVLink 互联
  4. NVSwitch 全互联

P


http://www.mrgr.cn/news/90115.html

相关文章:

  • DeepSeek从入门到精通:全面掌握AI大模型的核心能力
  • idea中git版本回退
  • AI知识库和全文检索的区别
  • 售后板子HDMI无输出分析
  • 单硬盘槽笔记本更换硬盘
  • sqli-labs靶场实录(二): Advanced Injections
  • 攻防世界32 very_easy_sql【SSRF/SQL时间盲注】
  • 【MQ】Spring3 中 RabbitMQ 的使用与常见场景
  • 【MQ】RabbitMQ 高可用延时功能的探究
  • 0 Rust与Qt集成实践指南(CXX-Qt)
  • 使用Redis实现业务信息缓存(缓存详解,缓存更新策略,缓存三大问题)
  • 【学Rust写CAD】5 三维转换矩阵解析及应用示例
  • MySQL数据库 - 阶段性体系总结
  • SQL自学,mysql从入门到精通 --- 第 1 天,系统环境搭建,mysql部署
  • 9.JVM-方法区
  • Java/Kotlin 使用 Chrome 无头浏览器
  • 免费windows pdf编辑工具Epdf
  • 【centos安装mysql数据库】详细版
  • SQL自学,mysql从入门到精通 --- 第 15天,数据导入、导出
  • QT-常见问题
  • 数据结构-find()-判断字符串s1中是否包含字符串s2
  • VirtualBox中Ubuntu 22.04网卡配置以及解决过程中遇到的问题
  • 【C++学习篇】C++11第二期学习
  • Docker 1. 基础使用
  • vue3 -- 基于el-statistic实现动态数字滚动效果并封装卡片组件
  • jupyterLab插件开发