NVIDIA GeForce 30系列

NVIDIA GeForce RTX 30系列NVIDIAGeForce RTX 20系列之後開發的圖形處理器系列。於2020年9月1日正式發佈,並於2020年9月17日開始發貨[1]

GeForce RTX 30系列
GeForce RTX 3090 創始版
發布日期2020年9月17日,​4年前​(2020-09-17
代號GA10x
架構Ampere
產品系列GeForce RTX
電晶體
  • 133億 (GA106)
  • 174億 (GA104)
  • 283億 (GA102)
製造工藝三星 8nm
顯示卡
中階GPUGeForce RTX 3050
GeForce RTX 3060
行動平台:
RTX 3050
RTX 3050Ti
RTX 3060
高端GPUGeForce RTX 3060 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti
行動平台:
RTX 3070
RTX 3070Ti
旗艦GPUGeForce RTX 3080
GeForce RTX 3080 Ti
GeForce RTX 3090
GeForce RTX 3090 Ti
行動平台:
RTX 3080
RTX 3080Ti
API支援
Direct3DDirect3D 12 Ultimate(12_2)
OpenGLOpenGL 4.6
OpenCLOpenCL 3.0
VulkanVulkan 1.3
歷史
前代產品NVIDIA GeForce 20系列
後繼產品NVIDIA GeForce 40系列

GeForce 30系列圖形處理器基於安培微架構,擁有第二代光線追蹤核心和第三代張量核心,Nvidia稱其運行效能和能效約為之前圖靈微架構圖形處理器的兩倍[1][2],使用三星電子8奈米工藝製造。

架構特性

編輯

在上一代圖靈架構,引入了分數據類型計算的理念,將整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算,提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算,INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率,新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU,取代了原本只支援INT 32計算的ALU。也就是說,現在有兩條不同的數據路徑(Datapath),一條能夠處理整數或單精度浮點,另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令,安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元,安培SM的共享快取/L1數據快取容量從96KB增長到了128KB,同時其帶寬變為原來的兩倍。

第二代RT Core

編輯

安培微架構的RT Core(Ray Tracing core,光線追蹤核心)在圖靈架構的基礎上將三角形求交模組數量增加到兩個(以並行方式運作),在基礎的BVH計算上面,新一代RT Core也能夠快上2倍。同時,第二代RT Core還增加了一個三角形位置內插模組,在允許BVH內的數據做少量更新的情況下,就能實現移動物體運動模糊效果的顯著效能提升。在OptiX 7.0 中,開發人員可以為幾何體指定特定的移動路徑,讓每條射線和時間關聯起來,從而實現移動物體的所有運動模糊效果加速。

第三代Tensor Core

編輯

Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元,可以執行基於深度學習的應用,例如光線追蹤降噪和DLSS抗鋸齒彩現。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core),每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構,每個SM裡有4個Tensor Core(每個子核有一個Tensor Core),但是每個Tensor Core的處理能力倍增,因此每個SM也能執行512個FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 兩種新的數據格式,並引入硬體稀疏化技術,操作的能力上增加一倍達到等效每週期1024 個FP16 操作。

產品

編輯
型號 推出日期 核心代號 製程 電晶體數
&
晶粒面積
核心組態[a] 二級暫存(MB) 時脈頻率 顯示記憶體 填充率 運算效能 (TFLOPS) 匯流排介面 TDP (W) NVLink支援 發售價格 (美金)
預設 (MHz) 加速 (MHz) 記憶體 (MT/s) 容量 (GiB) 頻寬 (GB/s) 類型 介面頻寬 (bit) 像素 (GP/s) 材質 (GT/s) 單精度 雙精度 半精度 張量 (FP16) 光追
GeForce RTX 3050 2022年1月27日 GA106-150-KA-A1 三星
8N
133億

276mm2

2560:80:32:80:28
(20) (3)
2 1552 1777 14000 8 224 GDDR6 128 49.6
56.86
124.1
142.2
7.946
9.098
0.124
0.142
7.946
9.098
PCIe 4.0
x8
130 $249
GeForce RTX 3060[3] 2021年
2月25日
GA106-300-A1 3584:112:48:112:28
(28) (3)
3 1320 15000 12 360.0 192 63.4

85.3

147.8

199.0

9.46

12.74

0.148

0.199

9.46

12.74

25 PCIe 4.0

x16

170 $329
2021年
9月1日
GA104-150-A1[4] 174億

392.5mm2

GeForce RTX 3060 Ti[5] 2020年
12月2日
GA104-200-A1 4864:152:80:152:38
(38) (6)
4 1410 1665 14000 8 448.0 256 112.8

133.2

214.3

253.1

13.72

16.20

0.214

0.253

13.70

16.20

?

129.6

32 200 $399
GeForce RTX 3070[6] 2020年
10月29日[7]
GA104-300-A1 5888:184:96:184:46
(46) (6)
1500 1725 144.0

165.6

276.0

317.4

17.66

20.31

0.276

0.318

17.66

20.37

141.31

162.98

40[8] 220 $499
GeForce RTX 3070 Ti[9] 2021年
6月10日
GA104-400-A1 6144:192:96:192:48
(48) (6)
1575 1770 9500 (19000)[b] 608.3 GDDR6X 151.18

169.9

302.36

339.8

19.35

21.75

0.302

0.340

19.35

21.75

290 $599
GeForce RTX 3080[10] 2020年
9月17日
GA102-200-KD-A1 283億

628.4mm2

8704:272:96:272:68
(68) (7)
5 1440 1710 10 760.0 320 138.2

164.2

391.68

465.12

25.07

29.77

0.392

0.465

25.06

29.76

200.54

238.14

58 320 $699
GeForce RTX 3080 Ti[11] 2021年
6月3日
GA102-225-A1 10240:320:112:320:80
(80) (7)
6 1395 1665 12 912.4 384 153.5

186.5

438.5

532.8

28.57

34.71

0.438

0.533

28.06

34.10

350 $1199
GeForce RTX 3090[12] 2020年
9月24日
GA102-300-A1 10496:328:112:328:82
(82) (7)
1395 1695 9750 (19500)[b] 24 935.8 156.2

189.8

457.6

555.96

29.28

35.58

0.459

0.558

29.38

35.68

235.08

285.48

69[8] 350 2路 NVLink $1499
GeForce RTX 3090 Ti[13] 2022年

3月22日

GA102-350-A1 10752:336:112:336:84

(84)(7)

1560 1860 10500

(21000)

1008 174.7

208.3

524.1

625.0

33.54

39.99

0.524

0.625

33.54

39.99

320 450 $1999
  1. ^ 流處理器數量:紋理對映單元數量:彩現輸出單元數量:張量核心數量:光線追蹤核心數量(SM數量)(GPC數量)。面向非專業用途的Ampere架構中每個GPC由16個ROP及最多12個SM組成,每個SM固定包括128個流處理器(單精度浮點處理器)、64個32位元長整型處理器、4個TMU、4個張量核心和1個光線追蹤核心;GA100核心的浮點處理器組態則略有不同,參見NVIDIA Tesla
  2. ^ 2.0 2.1 類似於早已在快閃記憶體行業應用的MLC技術,GDDR6X一次存取可以操作兩個位元,括號內用於比較GDDR6的等效傳輸速率

另見

編輯

參考文獻

編輯
  1. ^ 1.0 1.1 GeForce Special Event. 輝達. [September 1, 2020]. (原始內容存檔於2020-09-02). 
  2. ^ Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬體指南. August 31, 2020. 
  3. ^ NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. (原始內容存檔於2022-02-26). 
  4. ^ Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. (原始內容存檔於2021-11-13) (美國英語). 
  5. ^ NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. (原始內容存檔於2021-01-12). 
  6. ^ NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. (原始內容存檔於2021-05-14). 
  7. ^ GeForce RTX 3070 Availability Update. [2021-11-13]. (原始內容存檔於2022-01-11). 
  8. ^ 8.0 8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. (原始內容存檔於2022-01-12). 
  9. ^ NVIDIA GeForce RTX 3070 Family. [2021-06-02]. (原始內容存檔於2022-02-26). 
  10. ^ NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. (原始內容存檔於2021-05-19). 
  11. ^ NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. (原始內容存檔於2022-03-01). 
  12. ^ NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. (原始內容存檔於2022-02-26). 
  13. ^ 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. (原始內容存檔於2022-05-12) (中文(臺灣)). 

外部連結

編輯