安培微架構

NVIDIA設計的圖形處理單元微架構

安培微架構Ampere)是NVIDIA於2020年5月發佈的一個GPU架構。用以取代圖靈微架構(Turing microarchitecture)。命名為「安培」以向法國物理學家安德烈-馬里·安培(André-Marie Ampère)致敬。Ampere架構擁有電晶體達540億,是三星8nm級晶片。[1]是世界上電晶體最多的晶片,直到後來被蘋果M1 Max擊敗[2]

Nvidia Ampere
製造工藝
歷史
前代產品
後繼產品

NVIDIA在 GTC 2022 上宣佈了安培微架構的繼任者霍普微架構英語Hopper (microarchitecture)霍普(Hopper),並在 2021 年 GPU 技術大會上宣佈了 2024 年發佈的「Ampere Next Next」。

硬件

編輯
  • NVIDIA A100 Tensor Core GPU基於NVIDIA Ampere架構,是針對 AI、數據分析和 HPC的GPU[3]
  • DGX A100系統整合8個NVIDIA A100 Tensor Core GPU、有着320GB主記憶體,擁有NVIDIA Mellanox® HDR 200Gbps互連以及5Petaflops 的AI效能。[4]
  • DGX SuperPOD是140台DGX A100系統運用MellanoxHDR 200Gbps InfiniBand互連技術組成的一個叢集,AI計算能力達到了700Petaflops。[5]
  • NVIDIA EGX™ A100是NVIDIA於2020年5月發佈的基於Ampere架構的一款邊緣AI平台。[6]
  • NVIDIA GeForce 30系列
    • GeForce RTX 3050
    • GeForce RTX 3060
    • GeForce RTX 3060Ti
    • GeForce RTX 3070
    • GeForec RTX 3070Ti
    • GeForce RTX 3080 10GB
    • GeForce RTX 3080 12GB
    • GeForce RTX 3080Ti
    • GeForce RTX 3090
    • GeForce RTX 3090Ti

核心組態

編輯
核心代號 GPC SM/GPC 每個SM含有的各類核心 製程 影像記憶體支援 晶片面積(mm2 電晶體數(億個)
單精度浮點核心 雙精度浮點核心 32位元整數核心 張量運算核心 光線追蹤核心 紋理對映單元
GA100 8 16 64 32 64 4 - 4 台積電 7nm HBM2 826 542
GA102 7 12 128 - 1 三星 8nm GDDR6X 628 283
GA104 4 GDDR6 393 174
  • 在作為計算卡專用的GA100核心中,和其前身一樣,每個SM中安排有32個雙精度浮點核心;在作為非計算卡使用的GA102等核心中,這些雙精度浮點核心被替換為兩倍數量的單精度浮點核心。由於單精度浮點核心事實上作為絕大多數遊戲的流處理器,因此單個SM表觀流處理器數量達到上一代的2倍,RTX 3070的流處理器數量達到近6千個,接近上代旗艦RTX 2080 Ti;但相應的,用單精度浮點核心模擬雙精度的效率並不高,因此遊戲顯示卡的雙精度浮點計算速度(主要作用於挖礦深度學習等應用)相較上代並沒有明顯提升。
  • 電晶體密度:GA100使用台積電7nm製程達到約6600萬/mm2,GA102、GA104使用三星8nm製程達到約4500萬/mm2,而上代的圖靈全系列均使用台積電12nm製程,僅達到約2500萬/mm2
  • A100顯示卡中每個SM私有的L1/共用主記憶體容量達到了192KB,相比於前代V100顯示卡的128KB增加了1.5倍。

記錄

編輯

2020年7月,根據MLPerf基準測試結果,NVIDIA宣佈安培打破16項世界紀錄,包括加速器的八項基準測試和叢集DGX SuperPOD的八項。[7]

參考資料

編輯
  1. ^ 英伟达发布全新数据中心GPU-新浪网. www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. (原始內容存檔於2022-05-09) (中文(中國大陸)). 
  2. ^ 存档副本. [2021-10-20]. (原始內容存檔於2022-05-09). 
  3. ^ 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力-中国信息网. www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. (原始內容存檔於2021-03-18) (中文(中國大陸)). 
  4. ^ 性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. (原始內容存檔於2020-05-21) (中文(中國大陸)). 
  5. ^ NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. (原始內容存檔於2020-05-21) (中文(中國大陸)). 
  6. ^ 英伟达正式发布7nm安培GPU:八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. (原始內容存檔於2020-05-21) (中文(中國大陸)). 
  7. ^ NVIDIA安培打破16项世界纪录:一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. (原始內容存檔於2020-08-01) (中文(中國大陸)). 

外部連結

編輯