Windows 下的 CUDA 与 cuDNN 详细安装教程
本教程将详细介绍如何在 Windows 系统上安装 CUDA 和 cuDNN,为深度学习框架(如 PyTorch、TensorFlow)提供 GPU 加速支持。
CUDA 安装
简介
CUDA 介绍
CUDA(Compute Unified Device Architecture)是 NVIDIA 开发的并行计算平台和编程模型,用于利用 NVIDIA GPU 的并行计算能力,它允许开发者使用类似于 C 语言的编程语言编写并行程序,利用 GPU 的大规模并行计算能力加速各种类型的应用程序,包括科学计算、深度学习、图形渲染。
查看显卡信息
在命令提示符中,输入 nvidia-smi 命令:

| 信息类别 | 实际数值 | 描述 | 重要性 |
|---|---|---|---|
| GPU 型号 | NVIDIA GeForce RTX 4060 | 显卡具体型号 | 决定 CUDA 支持版本和计算能力 |
| GPU 索引 | 0 | GPU 设备标识符 | 多 GPU 系统中的设备识别 |
| 驱动版本 | 551.61 | NVIDIA 显卡驱动程序版本 | 影响 CUDA 兼容性和稳定性 |
| CUDA 版本 | 12.4 | 当前安装的 CUDA 工具包版本 | 决定支持的深度学习框架版本 |
| 显存总量 | 8188 MiB (约 8GB) | GPU 总显存容量 | 影响模型大小和批处理能力 |
| 显存使用率 | 1108 MiB / 8188 MiB (约 13.5%) | 当前显存使用情况 | 监控 GPU 资源利用情况 |
| GPU 利用率 | 4% | GPU 计算核心使用率 | 评估 GPU 工作负载 |
| 温度 | 59°C | GPU 当前运行温度 | 监控硬件健康状况 |
| 功耗限制 | 115W | GPU 最大功耗限制 | 评估能耗和散热需求 |
| 风扇转速 | 0% | GPU 风扇转速百分比 | 监控散热系统状态 |
| 性能状态 | P8 | GPU 当前性能模式 | 评估 GPU 工作状态 |
| 显示模式 | WDDM | Windows 显示驱动模型 | 影响图形和计算性能 |
| 总线 ID | 00000000:01:00.0 | PCI 总线标识符 | 硬件连接识别 |
| 显示状态 | On | 显示器连接状态 | 影响 GPU 资源分配 |
CUDA 下载
根据以上信息支持最高 CUDA12.4 版本,所以我们去官网下载对应的 CUDA Toolkit 版本或者低一两个版本。

进去后选择自己需要的类型下载

安装

这里的这个路径最好不要去修改,就使用默认路径,这里只是下载安装包的临时存放路径

同意并继续

选择自定义安装,精简版本是下载好所有组件,并且会覆盖原有驱动,所以在这里推荐自定义下载然后选择下一步

如果你是第一次安装,尽量全选 如果你是第 n 次安装,尽量只选择第一个,不然会出现错误 更改安装位置(可根据自己需求,如果以后想装多版本 CUDA,建议更改安装位置) 然后下一步

选择下一步,就开始安装了。安装完成后验证是否安装成功
打开命令提示符(CMD),输入:nvcc -V

出现以上信息这说明CUDA Toolkit已经安装成功!!!
安装 cuDNN
简介
cuDNN 介绍
cuDNN(CUDA Deep Neural Network library)是 NVIDIA 专门针对深度学习应用开发的 GPU 加速库。它提供了一系列高效的深度学习算法的实现,包括卷积神经网络(CNN)、循环神经网络(RNN)等常用网络结构的基本操作,如卷积、池化、归一化、激活函数等。cuDNN 针对 NVIDIA GPU 进行了高度优化,利用 GPU 的并行计算能力加速深度学习模型的训练和推理过程。通过使用 cuDNN,开发者可以轻松地将深度学习模型部署到支持 CUDA 的 NVIDIA GPU 上,并获得显著的性能提升。
下载
选择与 CUDA 版本匹配的 cuDNN 下载(如 cuDNN for CUDA 12.x)

解压下载好的安装文件 cuDNN 压缩包(如 cudnn-windows-x86_64-8.9.6.50_cuda12-archive.zip)

将解压后的文件复制到 CUDA 安装目录:
CUDA的默认的安装路径:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4复制下面三个文件夹到 CUDA 中

验证安装
进入 CUDAC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\demo_suite文件夹,然后执行deviceQuery.exe

如果结果为 pass 证明安装成功

