[Docker] [Ubuntu] 安装 Docker 并启用CUDA加速
本机环境
简单介绍一下本机环境, 以便出现问题时排查
宿主机硬件:
CPU: Intel Xeon Gold 6138 * 2
Memory: 8 * 32G ECC DDR4 Total: 256G
GPU: Nvidia RTX 4060 8GB
Host System: Windows 11 Pro Workstation
Work System: WSL2-Ubuntu 22.04
.wslconfig
配置文件:
[wsl2]
processors=80
memory=64GB
vmSwitch=LAN
networkingMode=bridged
ipv6=false
dhcp=false
前提条件
硬件条件
有一张支持cuda加速的
Nvidia
显卡
WSL2 前提条件
安装合适的Nvidia驱动, 建议使用最新的Nvidia Studio驱动
安装 WSL2, 常见报错代码和解决方法
Windows 11 Pro 或 Windows 10 Pro Insider Preview
验证条件, 可以通过 Powershell 和 WSL2 中输入
nvidia-smi
验证, 看到以下相似的输出即可
Ubuntu/Linux 前提条件
安装合适的Nvidia驱动, 建议使用最新的Nvidia Studio驱动
验证条件, 可以通过 Powershell 和 WSL2 中输入
nvidia-smi
验证
安装 Docker
之前写过了, 点击这里 查看教程
配置Nvidia-docker
配置 production repository
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
配置 repository
sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update
安装 NVIDIA Container Toolkit
sudo apt-get install -y nvidia-container-toolkit
配置runtime
sudo nvidia-ctk runtime configure --runtime=docker
重启docker进程
sudo systemctl restart docker
测试Cuda加速能不能使用
docker run --gpus all nvcr.io/nvidia/k8s/cuda-sample:nbody nbody -gpu -benchmark
看到如下提示说明docker可以正常使用并使用Cuda加速
[Docker] [Ubuntu] 安装 Docker 并启用CUDA加速
http://localhost:8090/archives/ubuntucudadocker