安培微架构

NVIDIA設計的圖形處理單元微架構

安培微架构Ampere)是NVIDIA于2020年5月发布的一个GPU架构。用以取代图灵微架构(Turing microarchitecture)。命名为“安培”以向法国物理学家安德烈-马里·安培(André-Marie Ampère)致敬。Ampere架构拥有晶体管达540亿,是三星8nm级晶片。[1]是世界上晶体管最多的晶片,直到后来被苹果M1 Max击败[2]

Nvidia Ampere
制造工艺
历史
前代产品
后继产品

NVIDIA在 GTC 2022 上宣布了安培微架构的继任者霍普微架构英语Hopper (microarchitecture)霍普(Hopper),并在 2021 年 GPU 技术大会上宣布了 2024 年发布的“Ampere Next Next”。

硬件

编辑
  • NVIDIA A100 Tensor Core GPU基于NVIDIA Ampere架构,是针对 AI、数据分析和 HPC的GPU[3]
  • DGX A100系统集成8个NVIDIA A100 Tensor Core GPU、有着320GB内存,拥有NVIDIA Mellanox® HDR 200Gbps互连以及5Petaflops 的AI性能。[4]
  • DGX SuperPOD是140台DGX A100系统运用MellanoxHDR 200Gbps InfiniBand互连技术组成的一个集群,AI计算能力达到了700Petaflops。[5]
  • NVIDIA EGX™ A100是NVIDIA于2020年5月发布的基于Ampere架构的一款边缘AI平台。[6]
  • NVIDIA GeForce 30系列
    • GeForce RTX 3050
    • GeForce RTX 3060
    • GeForce RTX 3060Ti
    • GeForce RTX 3070
    • GeForec RTX 3070Ti
    • GeForce RTX 3080 10GB
    • GeForce RTX 3080 12GB
    • GeForce RTX 3080Ti
    • GeForce RTX 3090
    • GeForce RTX 3090Ti

核心配置

编辑
核心代号 GPC SM/GPC 每个SM含有的各类核心 制程 显存支持 晶片面积(mm2 晶体管数(亿个)
单精度浮点核心 双精度浮点核心 32位整数核心 张量运算核心 光线追踪核心 纹理映射单元
GA100 8 16 64 32 64 4 - 4 台积电 7nm HBM2 826 542
GA102 7 12 128 - 1 三星 8nm GDDR6X 628 283
GA104 4 GDDR6 393 174
  • 在作为计算卡专用的GA100核心中,和其前身一样,每个SM中安排有32个双精度浮点核心;在作为非计算卡使用的GA102等核心中,这些双精度浮点核心被替换为两倍数量的单精度浮点核心。由于单精度浮点核心事实上作为绝大多数游戏的流处理器,因此单个SM表观流处理器数量达到上一代的2倍,RTX 3070的流处理器数量达到近6千个,接近上代旗舰RTX 2080 Ti;但相应的,用单精度浮点核心模拟双精度的效率并不高,因此游戏显卡的双精度浮点计算速度(主要作用于挖矿深度学习等应用)相较上代并没有明显提升。
  • 晶体管密度:GA100使用台积电7nm制程达到约6600万/mm2,GA102、GA104使用三星8nm制程达到约4500万/mm2,而上代的图灵全系列均使用台积电12nm制程,仅达到约2500万/mm2
  • A100显卡中每个SM私有的L1/共享内存容量达到了192KB,相比于前代V100显卡的128KB增加了1.5倍。

记录

编辑

2020年7月,根据MLPerf基准测试结果,NVIDIA宣布安培打破16项世界纪录,包括加速器的八项基准测试和集群DGX SuperPOD的八项。[7]

参考资料

编辑
  1. ^ 英伟达发布全新数据中心GPU-新浪网. www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. (原始内容存档于2022-05-09) (中文(中国大陆)). 
  2. ^ 存档副本. [2021-10-20]. (原始内容存档于2022-05-09). 
  3. ^ 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力-中国信息网. www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. (原始内容存档于2021-03-18) (中文(中国大陆)). 
  4. ^ 性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. (原始内容存档于2020-05-21) (中文(中国大陆)). 
  5. ^ NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. (原始内容存档于2020-05-21) (中文(中国大陆)). 
  6. ^ 英伟达正式发布7nm安培GPU:八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. (原始内容存档于2020-05-21) (中文(中国大陆)). 
  7. ^ NVIDIA安培打破16项世界纪录:一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. (原始内容存档于2020-08-01) (中文(中国大陆)). 

外部链接

编辑