当前位置: 首页 > news >正文

Nvidia GPU相关

Nvidia GPU相关

  • 1、Linux 下GPU驱动安装
  • 2、docker 容器GPU驱动(nvidia-container-toolkit)
    • 一、 安装nvidia-container-toolkit
    • 二、验证 GPU 支持

1、Linux 下GPU驱动安装

安装Nvidia显卡驱动、CUDA、cuDNN
参考:链接

2、docker 容器GPU驱动(nvidia-container-toolkit)

一、 安装nvidia-container-toolkit

Nvidia Container Toolkit,该工具使Docker 的容器能与主机的Nvidia显卡进行interact.
当运行 docker run -it --name xxx --gpus all … 时(主要是带有 --gpu all)出现以下报错,大概率是表明Docker无法成功分配或访问GPU资源。

docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].
  1. 安装和确认 NVIDIA 驱动
    确保你的宿主机安装了支持你的NVIDIA GPU的驱动。可以通过运行 nvidia-smi 来检查驱动是否已安装和GPU是否被识别。

    nvidia-smi
    
  2. 安装NVIDIA Container Toolkit
    NVIDIA Container Toolkit(包括nvidia-docker)是必需的,以便Docker可以管理和使用GPU。可以按照NVIDIA官方文档的指示进行安装。
    官方文档链接:

     https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html#prerequisiteshttps://github.com/NVIDIA/nvidia-container-toolkit
    

例如centos上安装:
在这里插入图片描述
国内网络限速问题:直接代理,或者下面手动安装
1.更换国内Linux软件源:参考:链接
2、
手动下载nvidia-container-toolkit.repo 镜像源,复制到yum.repos.d镜像目录下

curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo | \sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
上面命令手动下:nvidia-container-toolkit.repo 文件
然后:cp nvidia-container-toolkit.repo  /etc/yum.repos.d/nvidia-container-toolkit.repo
接着:
清理YUM缓存:
yum clean all
生成新的缓存:
yum makecache
验证YUM源配置
yum updatesudo yum-config-manager --enable nvidia-container-toolkit-experimental
sudo yum install -y nvidia-container-toolkit

3.第二步不行的话,去GitHub 下载release包安装,很麻烦有很多依赖。

二、验证 GPU 支持

通过以下命令验证 Docker 是否可以访问 GPU:
参考:链接1、 链接2

$ sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
docker run --rm --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi
$ sudo docker run --rm -e NVIDIA_VISIBLE_DEVICES=all nvidia/cuda:11.0-base nvidia-smi
$ sudo docker run --rm hello-world

http://www.mrgr.cn/news/57770.html

相关文章:

  • Spring Boot整合Quartz定时任务详解
  • disql 全量备份SQL脚本DM7/DM8
  • 市场上最受欢迎的6 大顶级安卓手机解锁软件
  • arcpy中建立金字塔
  • Qt第十三天:网络编程:TCP和UDP的使用
  • 基于RabbitMQ,Redis,Redisson,RocketMQ四种技术实现订单延时关闭功能及其相关优缺点介绍(以12306为主题)
  • 洛谷题解 - P1162 填涂颜色
  • 企业建立质量管理系统的目的是什么?
  • 软件测试面试题600多条及答案
  • QT QGestureEvent支持平移,缩放,旋转触摸板手势
  • IntelliJ IDEA 安装 Maven 工具并更换阿里源
  • Vue2基础实例——实现移动端静态页面(CDN引入方式)
  • The database mes could not be exclusively locked to perform the operation.
  • Claude 3.5全面升级,AI 时代?我将何去何从
  • 六.python面向对象
  • ubuntu系统如何在本地查看服务器上的tensorboard结果
  • Python3入门--数据类型
  • 经典功率谱估计的原理及MATLAB仿真(自相关函数BT法、周期图法、bartlett法、welch法)
  • 机器学习在智能水泥基复合材料中的应用与实践
  • 在 Go 中,如何实现一个带过期时间的字典映射
  • 富格林:可信操作助力有效追损
  • C/C++每日一练:实现冒泡排序
  • uniapp实现多文件下载,保存到本地
  • 凯撒密码-图形化实现(Scratch)
  • LeetCode常用算法模板
  • 国内 Docker 镜像加速与 GitHub 加速服务:CNPROXY.TOP