[Docker] [Ubuntu] 安装 Docker 并启用CUDA加速

本机环境

简单介绍一下本机环境, 以便出现问题时排查

宿主机硬件:

CPU: Intel Xeon Gold 6138 * 2

Memory: 8 * 32G ECC DDR4 Total: 256G

GPU: Nvidia RTX 4060 8GB

Host System: Windows 11 Pro Workstation

Work System: WSL2-Ubuntu 22.04

.wslconfig 配置文件:

[wsl2]
processors=80
memory=64GB
vmSwitch=LAN
networkingMode=bridged
ipv6=false
dhcp=false

前提条件

硬件条件

  • 有一张支持cuda加速的Nvidia 显卡

WSL2 前提条件

  • 安装合适的Nvidia驱动, 建议使用最新的Nvidia Studio驱动

  • 安装 WSL2, 常见报错代码和解决方法

  • Windows 11 Pro 或 Windows 10 Pro Insider Preview

  • 验证条件, 可以通过 Powershell 和 WSL2 中输入nvidia-smi验证, 看到以下相似的输出即可

Ubuntu/Linux 前提条件

  • 安装合适的Nvidia驱动, 建议使用最新的Nvidia Studio驱动

  • 验证条件, 可以通过 Powershell 和 WSL2 中输入nvidia-smi验证

安装 Docker

之前写过了, 点击这里 查看教程

配置Nvidia-docker

官方教程

配置 production repository

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

配置 repository

sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update

安装 NVIDIA Container Toolkit

sudo apt-get install -y nvidia-container-toolkit


配置runtime

sudo nvidia-ctk runtime configure --runtime=docker

重启docker进程

sudo systemctl restart docker

测试Cuda加速能不能使用

docker run --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark

看到如下提示说明docker可以正常使用并使用Cuda加速


[Docker] [Ubuntu] 安装 Docker 并启用CUDA加速
http://localhost:8090/archives/ubuntucudadocker
作者
Gzcheng
发布于
2024年09月21日
更新于
2024年10月29日
许可协议