NVIDIA CUDA 工具包提供了开发环境,可供开发、优化和部署经 GPU 加速的高性能应用。

什么是 CUDA 工具包

NVIDIA CUDA 工具包提供了开发环境,可供创建经 GPU 加速的高性能应用。借助 CUDA 工具包,您可以在经 GPU 加速的嵌入式系统、台式工作站、企业数据中心、基于云的平台和 HPC 超级计算机中开发、优化和部署应用。此工具包中包含多个 GPU 加速库、多种调试和优化工具、一个 C/C++ 编译器以及一个用于部署应用的运行环境库。

借助多 GPU 配置中用于分布式计算的多项内置功能,科学家和研究人员能够开发出可从单个 GPU 工作站扩展到配置数千个 GPU 云端设施的应用。

CUDA 11 主要功能

CUDA 11 可为 NVIDIA Ampere 架构、ARM 服务器处理器、性能优化库以及多种开发者工具新功能提供支持。对 NVIDIA Ampere 架构的支持包括新一代 Tensor Core、混合精度模式、多实例 GPU (MIG)、高级内存管理以及标准 C++/Fortran 并行语言结构。

  • 支持 NVIDIA Ampere GPU 架构,包括新的 NVIDIA A100 GPU,用于加速 AI 和 HPC 数据中心的扩展;采用 NVSwitch 结构的多 GPU 系统,如 DGX A100 和 HGX A100。
  • 多实例 GPU(MIG) 分区功能,对云服务提供商(csp)提高 GPU 利用率非常有利。
  • 全新第三代 Tensor Cores 加速不同数据类型的混合精度,包括 TF32 和 Bfloat16。
  • 用于任务图、异步数据移动、细粒度同步和二级缓存驻留控制的编程和 API。
  • CUDA 库中用于线性代数、FFT 和矩阵乘法进行性能优化。
  • Nsight 产品系列的更新,用于跟踪、剖析和调试 CUDA 应用程序。
  • 全面支持所有主要 CPU 体系结构,跨 x86 _ 64、Arm64 服务器和 POWER 结构。

更多详情指引

CUDA 文档版本说明

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

CUDA-X 库

https://developer.nvidia.cn/gpu-accelerated-libraries

培训

https://developer.nvidia.cn/accelerated-computing-training

示例代码

https://developer.nvidia.cn/cuda-code-samples

点击链接,下载并了解更多关于 CUDA 工具包更新内容

https://developer.nvidia.cn/cuda-downloads