DukeDuke
主页
项目文档
技术文档
  • 单机版
  • 微服务
  • 代办项目
  • 优鲜项目
项目管理
关于我们
主页
项目文档
技术文档
  • 单机版
  • 微服务
  • 代办项目
  • 优鲜项目
项目管理
关于我们
  • 技术文档

    • 网络原理

      • 交换机
      • 路由器
      • TCP/IP协议
      • HTTP 与 HTTPS
    • 软件架构

      • 什么是软件架构
      • 分层架构
      • 微服务架构
      • 事件驱动架构
      • 领域驱动设计(DDD)
      • 架构图
      • 高并发系统
    • Vue3

      • Vue3简介
      • Vue3响应式系统
      • Vue3组合式API
      • Vue3生命周期
      • Vue3模板语法
      • Vue3组件系统
      • Vue3 路由系统
      • Vue3 状态管理
      • Vue3 性能优化
      • Vue3 TypeScript 支持
      • Vue3 项目实战
      • VUE 面试题大全
      • Node.js 安装
    • JAVA

      • JVM

        • 认识JVM
        • JVM类加载器
        • 运行时数据区
        • 执行引擎
        • 本地方法接口
        • 本地方法库
        • JVM垃圾回收
        • JVM性能监控
        • JVM调优
      • 设计模式
        • 单例模式
        • 工厂模式
        • 策略模式
        • 适配器模式
        • 建造者模式
        • 原型模式
        • 装饰器模式
        • 代理模式
        • 外观模式
        • 享元模式
        • 组合模式
        • 桥接模式
      • Java多线程

        • Java 线程基础详解
        • Java 线程池详解
        • Java ThreadLocal 详解
        • Java volatile 详解
        • Java 线程间通信详解
        • Java 线程安全详解
        • Java 线程调度详解
        • Java 线程优先级详解

        • Java 线程中断详解
        • Java 线程死锁详解
      • Java反射
      • Java 面试题

        • Java 基础概念面试题
        • Java 面向对象编程面试题
        • Java 集合框架面试题
        • Java 多线程与并发面试题
        • JVM 与内存管理面试题
        • Java I/O 与 NIO 面试题
        • Java 异常处理面试题
        • Java 反射与注解面试题
        • Java Spring 框架面试题
        • Java 数据库与 JDBC 面试题
        • Java 性能优化面试题
        • Java 实际项目经验面试题
        • Java 高级特性面试题
        • Java 面试准备建议
    • Python

      • Python简介
      • Python安装
      • Python hello world
      • Python基础语法
      • Python数据类型
      • Python数字
      • Python字符串
      • Python列表
      • Python元组
      • Python字典
      • Python日期时间
      • Python文件操作
      • Python异常处理
      • Python函数
      • Python类
      • Python模块
      • Python包
      • Python多线程
      • Python面向对象
      • Python爬虫
      • Django web框架
      • Python 面试题

        • Python 面试题导航
        • Python 基础概念
        • Python 面向对象编程
        • Python 数据结构
        • Python 高级特性
        • Python 框架
        • Python 性能优化
        • Python 项目经验
    • Spring

      • Spring
      • Springboot
      • Spring Security 安全框架
      • SpringBoot 中的事件详解
      • SpringBoot 中的定时任务详解
      • SpringBoot 自动装配原理与源码解释
    • Mybatis

      • Mybatis
      • Mybatis-Plus
    • 数据库

      • Redis

        • Redis简介
        • Redis(单机)安装
        • Redis配置
        • Redis数据结构
        • RDB、AOF 和混合持久化机制
        • Redis内存管理
        • Redis缓存一致性
        • Redis缓存穿透
        • Redis缓存击穿
        • Redis缓存雪崩
        • Redis Lua脚本
        • Redis主从复制
        • Redis哨兵模式
        • Redis集群
        • Redis数据分片
        • Redis CPU使用率过高
        • Redis面试题
      • MySQL

        • MySQL简介
        • MySQL安装
        • MySQL配置
        • MYSQL日常维护
        • MYSQL优化-慢查询
        • MYSQL优化-索引
        • MYSQL数据库设计规范
    • 消息队列

      • RocketMQ
      • Kafka
      • RabbitMQ
      • 消息队列面试题
    • 微服务

      • SpringCloud 微服务
      • Eureka 注册中心
      • Nacos 注册中心
      • Gateway 网关
      • Feign 服务调用
      • Sentinel 限流 与 熔断
      • Seata 分布式事务
      • CAP 理论
      • Redis 分布式锁
      • 高并发系统设计
    • ELK日志分析系统

      • Elasticsearch 搜索引擎
      • Logstash 数据处理
      • Kibana 可视化
      • ELK 实战
    • 开放API

      • 开放API设计
      • 开放API示例项目
    • 人工智能

      • 人工智能简介
      • 机器学习

      • 深度学习

      • 自然语言处理

      • 计算机视觉

        • CUDA与cuDNN详细安装
        • Conda 安装
        • Pytorch 深度学习框架
        • yolo 目标检测
        • TensorRT 深度学习推理优化引擎
        • TensorFlow 机器学习
        • CVAT 图像标注
        • Windows 下安装 CUDA、cuDNN、TensorRT、TensorRT-YOLO 环境
        • Windows10+CUDA+cuDNN+TensorRT+TensorRT-YOLO 部署高性能YOLO11推理
    • 大数据

      • 大数据简介
      • Hadoop 数据存储
      • Flume 数据采集
      • Sqoop 数据导入导出
      • Hive 数据仓库
      • Spark 数据处理
      • Flink 数据处理
      • Kafka 数据采集
      • HBase 数据存储
      • Elasticsearch 搜索引擎
    • 图像处理

      • 图像处理简介
      • 医学图像web呈现
      • 医学图像处理
      • 切片细胞分离问题
    • 服务器&运维

      • Linux 系统

        • Linux 系统管理
        • Linux 网络管理
        • Linux 文件管理
        • Linux 命令大全
      • Nginx Web 服务器

        • Nginx 安装 与 配置
        • Nginx 负载均衡
        • Nginx SSL证书配置
        • Nginx Keepalived 高可用
      • Docker 容器

        • Docker 简介
        • Docker 安装与配置
        • Docker 命令
        • Docker 部署 Nginx
        • Docker 部署 MySQL
        • Docker 部署 Redis
      • 服务器

        • 塔式服务器
        • 机架式服务器
        • 刀片服务器
      • Git 版本控制
      • Jenkins 持续集成
      • Jmeter 性能测试
      • Let's Encrypt 免费SSL证书
    • 简历

      • 项目经理简历
      • 开发工程师简历

Windows 下的 CUDA 与 cuDNN 详细安装教程

本教程将详细介绍如何在 Windows 系统上安装 CUDA 和 cuDNN,为深度学习框架(如 PyTorch、TensorFlow)提供 GPU 加速支持。

CUDA 安装

简介

CUDA 介绍

CUDA(Compute Unified Device Architecture)是 NVIDIA 开发的并行计算平台和编程模型,用于利用 NVIDIA GPU 的并行计算能力,它允许开发者使用类似于 C 语言的编程语言编写并行程序,利用 GPU 的大规模并行计算能力加速各种类型的应用程序,包括科学计算、深度学习、图形渲染。

查看显卡信息

在命令提示符中,输入 nvidia-smi 命令:

HSV

信息类别实际数值描述重要性
GPU 型号NVIDIA GeForce RTX 4060显卡具体型号决定 CUDA 支持版本和计算能力
GPU 索引0GPU 设备标识符多 GPU 系统中的设备识别
驱动版本551.61NVIDIA 显卡驱动程序版本影响 CUDA 兼容性和稳定性
CUDA 版本12.4当前安装的 CUDA 工具包版本决定支持的深度学习框架版本
显存总量8188 MiB (约 8GB)GPU 总显存容量影响模型大小和批处理能力
显存使用率1108 MiB / 8188 MiB (约 13.5%)当前显存使用情况监控 GPU 资源利用情况
GPU 利用率4%GPU 计算核心使用率评估 GPU 工作负载
温度59°CGPU 当前运行温度监控硬件健康状况
功耗限制115WGPU 最大功耗限制评估能耗和散热需求
风扇转速0%GPU 风扇转速百分比监控散热系统状态
性能状态P8GPU 当前性能模式评估 GPU 工作状态
显示模式WDDMWindows 显示驱动模型影响图形和计算性能
总线 ID00000000:01:00.0PCI 总线标识符硬件连接识别
显示状态On显示器连接状态影响 GPU 资源分配

CUDA 下载

根据以上信息支持最高 CUDA12.4 版本,所以我们去官网下载对应的 CUDA Toolkit 版本或者低一两个版本。

HSV

进去后选择自己需要的类型下载

HSV

安装

HSV

这里的这个路径最好不要去修改,就使用默认路径,这里只是下载安装包的临时存放路径

HSV

同意并继续

HSV

选择自定义安装,精简版本是下载好所有组件,并且会覆盖原有驱动,所以在这里推荐自定义下载然后选择下一步

HSV

如果你是第一次安装,尽量全选 如果你是第 n 次安装,尽量只选择第一个,不然会出现错误 更改安装位置(可根据自己需求,如果以后想装多版本 CUDA,建议更改安装位置) 然后下一步

HSV

选择下一步,就开始安装了。安装完成后验证是否安装成功

打开命令提示符(CMD),输入:nvcc -V

HSV

出现以上信息这说明CUDA Toolkit已经安装成功!!!

安装 cuDNN

简介

cuDNN 介绍

cuDNN(CUDA Deep Neural Network library)是 NVIDIA 专门针对深度学习应用开发的 GPU 加速库。它提供了一系列高效的深度学习算法的实现,包括卷积神经网络(CNN)、循环神经网络(RNN)等常用网络结构的基本操作,如卷积、池化、归一化、激活函数等。cuDNN 针对 NVIDIA GPU 进行了高度优化,利用 GPU 的并行计算能力加速深度学习模型的训练和推理过程。通过使用 cuDNN,开发者可以轻松地将深度学习模型部署到支持 CUDA 的 NVIDIA GPU 上,并获得显著的性能提升。

下载

选择与 CUDA 版本匹配的 cuDNN 下载(如 cuDNN for CUDA 12.x)

HSV

解压下载好的安装文件 cuDNN 压缩包(如 cudnn-windows-x86_64-8.9.6.50_cuda12-archive.zip)

HSV

将解压后的文件复制到 CUDA 安装目录:

  • CUDA的默认的安装路径: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4

  • 复制下面三个文件夹到 CUDA 中

HSV

验证安装

进入 CUDAC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\demo_suite文件夹,然后执行deviceQuery.exe

HSV

如果结果为 pass 证明安装成功

HSV

最近更新:: 2025/10/10 09:23
Contributors: Duke
Next
Conda 安装