当前位置: 首页 > news >正文

天下苦英伟达久矣!PyTorch官方免CUDA加速推理,Triton时代要来?

在做大语言模型(LLM)的训练、微调和推理时,使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与计算范畴,同样严重依赖 CUDA,使用它加速的机器学习模型可以实现更大的性能提升。

虽然 CUDA 在加速计算领域占据主导地位,并成为英伟达重要的护城河之一。但其他一些工作的出现正在向 CUDA 发起挑战,比如 OpenAI 推出的 Triton,它在可用性、内存开销、AI 编译器堆栈构建等方面具有一定的优势,并持续得到发展。

近日,PyTorch 官宣要做「无英伟达 CUDA 参与的大模型推理」。在谈到为什么要 100% 使用 Triton 进行探索时,PyTorch 表示:「Triton 提供了一条途径,使大模型 能够在不同类型的 GPU 上运行,包括英伟达、AMD、英特尔和其他基于 GPU 的加速器。

此外 Triton 还在 Python 中为 GPU 编程提供了更高的抽象层,使得使用 PyTorch 能够比使用供应商特定的 API 更快地编写高性能内核。」

图片

在 PyTorch 博客中讨


http://www.mrgr.cn/news/26305.html

相关文章:

  • 基于Python实现一个庆祝中秋节的小程序
  • 密码学---黄道十二宫
  • MySQL 日志篇:Redo 文件和自适应检查点
  • 速通GPT-2:Language Models are Unsupervised Multitask Learners全文解读
  • mysql笔记8(多表查询)
  • 【【通信协议之ICMP协议】】
  • 质量体系和质量过程管理及SCIOT平台质量管理功能简介
  • Java项目: 基于SpringBoot+mybatis+maven宠物咖啡馆平台(含源码+数据库+毕业论文)
  • 《C++PrimerPlus》第10章:类和对象
  • linux-IO-进程-线程(相关函数)
  • linux-L7-linux 查看json文件
  • 在VMware上怎么安装Windows11?看这个教程就足够了
  • MySQL基本查询
  • MySQL EXPLAIN输出信息
  • 高效率免费创作文章,4款ai写作生成器来帮忙
  • wopop靶场漏洞挖掘练习
  • AV1 Bitstream Decoding Process Specification--[4]:语法结构
  • 英文软件汉化中文软件教程asi exe dll 等汉化教程
  • PyTorch安装指南:轻松上手深度学习框架(CUDA)
  • ORCA-3D避障算法解析