NVIDIA GeForce 20系列

NVIDIA GeForce RTX 20系列,是由NVIDIAGeForce GTX 10系列後開發的圖形處理器系列。於2018年8月20日的Gamescom(科隆遊戲展)上發布。[1][2][3]本系列首發產品是GeForce RTX 2080及2080Ti,2018年9月20日正式發售[4]。此系列產品新命名為RTX,而未沿用推出多年的GTX,以突顯支援光線跟蹤的特色。

Geforce RTX 20 系列

RTX 2080Ti 創始版
發布日期2018年9月20日,​6年前​(2018-09-20
2019年7月9日,​5年前​(2019-07-09
(Super系列)
代號TU10x
架構Turing
產品系列GeForce RTX
電晶體
  • 108億 12nm(TU106)
  • 136億 12nm(TU104)
  • 186億 12nm(TU102)
製造工藝台積電 12nm(FinFET)
顯示卡
中端GPUGeForce RTX 2050
GeForce RTX 2060
GeForce RTX 2060 Super
高端GPUGeForce RTX 2070
GeForce RTX 2070 Super
GeFroce RTX 2080
GeForce RTX 2080 Super
旗艦GPUGeForce RTX 2080 Ti
NVIDIA TITAN RTX
API支持
Direct3DDirect3D 12 (12_2)
OpenGLOpenGL 4.6
OpenCLOpenCL 1.2
VulkanVulkan 1.2
歷史
前代產品GeForce 10系列
相關產品GeForce 16系列
後繼產品GeForce 30系列

架構特性

編輯

RTX 20系列基於圖靈微架構(Turing),具有實時光線跟蹤(Ray tracing)功能。[5]通過使用RT核心(光線追蹤運算核心)可以加速這一過程。這些核心能夠高效處理四叉樹和球形層次結構,並在碰撞模擬的過程中更快地為三角面組成的立體模型進行物體碰撞模擬。

RT核心的光線追蹤功能在模擬反射、折射和陰影的操作上可以取代傳統立方體貼圖深度貼圖的光柵技術。從光線追蹤運算得到的信息可以增強陰影使畫面更加逼真,尤其是可以將發生於屏幕畫面以外的動作通過陰影和光線反射渲染到畫面之中。

張量運算核心(Tensor Core)進一步加速了光線追蹤,並用於填充部分渲染圖像中的空白,這種技術被稱為「降噪」。張量核心原是為深度學習而設計的,例如學習如何提高圖像的分辨率。但通常消費者的張量核心主要是執行一些已經完成的深度學習模型,這些模型是在超級計算機進行分析和解決的,超級計算機確定如何實現這些目標的方法,例如學習如何提高圖像的分辨率,然後由消費者的張量核心實際使用這個方法,也就是使用超級計算機找到的方法來提高圖像的分辨率。

因此,圖靈架構的光線追蹤特性,實際上是舊有光線追蹤技術與近年興起的人工智慧(AI)、深度學習結合的產物,先是利用光線追蹤專用的運算單元RT core生成圖像的關鍵要素,剩餘的非關鍵要素則是交由深度學習運算單元Tensor Core來補全,而圖像中的關鍵要素,也藉由Tensor Core執行相關的深度學習程式來決定。除此以外,Tensor Core還被用於執行消除混疊的深度學習程式(深度學習超級採樣,DLSS),來柔化畫面鋸齒邊緣。[6]

深度學習光線追蹤用於畫面運算雖然不是首個,NVIDIA早在基於帕斯卡伏打圖形處理微架構的GeForce GTX TITAN系列上有先行鋪路,光線追蹤更是早已有之的技術,只是當時裝置的效能僅能到作生成靜態畫面之用,而本代GeForce RTX系列則是首個在畫面處理中大量使用深度學習技術、引入與深度學習相結合的光線追蹤實時動態畫面技術的圖形處理器。不過它仍然保留了效能強勁、規格龐大的傳統光柵化渲染3D畫面所需的運算組件。[7]

細節

編輯
  • 採用台積電12nm FFN製程打造,由伏特微架構使用的12nm FFC製程改進(但本質上依舊是台積電16nm FF+製程的延伸版本),性能是後者的1.1倍,功耗只有後者的70%,核心面積則可以縮小20%
  • 為容納數量龐大的運算單元,核心面積相比帕斯卡微架構的大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm 2
  • CUDA 7.5
  • 採用全新的SM陣列設計: TPC包含了兩個SM單元(Pascal為1個),SM單元重新分配為64個FP32、64個INT32、8個Tensor Core 、1個RT Core ,同時添加了獨立的INT數據路徑,支援FP32和INT32操作的並發執行。
  • 為共享暫存、一級暫存、紋理暫存引入了統一架構,一級暫存與共享暫存大小是靈活可變的,可以根據需要在64+32KB或者32+64KB之間變換,讓一級暫存更充分利用資源,也減少一級暫存延遲,並提供比Pascal GPU中使用的一級暫存更高的頻寬,同時二級暫存容量提升。
  • Tensor Core(張量核心) : 負責人工智慧、神經網路運算,增加了新的INT8和INT4精度模式,FP16半精度也能夠被完整支援通常會用到矩陣融合乘加(FMA)運算,新的INT8精度模式的工作速率是此速率的兩倍,張量核心為矩陣運算提供了顯著的加速,除了新的神經圖形功能外,還用於深度學習訓練和推理操作。
  • NGX (Neural Graphics Acceleration)框架: 利用張量核心,在遊戲中實現深度學習功能,GeForce Experience會自動匹配Turing顯卡並且下載可用的NGX Core軟件包,對應如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
  • DLSS (深度學習超級採樣) : 反鋸齒技術,利用張量核心實現在較低的輸入樣本數下更快地渲染,具有與64×超級採樣畫面相同品質的細節,還可以避免TAA產生的運動模糊等問題,相比TAA等其它反鋸齒技術,渲染能力得到大幅提升。
  • AI InPainting : 算法利用大量真實世界圖像的訓練,可以補全圖片中缺失的內容,也可以移除照片的噪點、失真部分以及增強照片的清晰度等功能。
  • AI Super Rez : 將原影片的解析度清晰地放大2倍、4倍、8倍,圖像更加銳利。
  • AI Slow-Mo : 將普通常見的30fps進行智慧補幀計算,可以獲得240/480fps的慢動作影片,而不需要專門高幀率攝影機。
  • RT Core : 專門為光線追蹤計算,是一條特異化的專用流水線,用於加速計算邊界體積層次(BVH)遍歷以及光線和三角求交(光線投射)。
  • GDDR6顯示記憶體的支援
  • 附有影像串流壓縮技術(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
  • 功能集PureVideo的硬體加速視訊解碼
  • NVLink連接器(與伏打微架構的不相容)
  • VirtualLink VR
  • GPU Boost 4[8]

設計

編輯

RTX是GeForce 20系列引入的開發平台。RTX的光線追蹤示範程序中使用了微軟的DXR,OptiX和Vulkan來進行光線追蹤。[9]

芯片規格

編輯
型號 推出日期 核心
代號
製程
(nm)
晶體管數
&
晶粒面積
核心配置 時脈頻率 填充率 顯示記憶體 運算性能 (TFLOPS) 每秒
光線數
(十億)
匯流排
介面
TDP
(W)
NVLink
支援
發售價格(美金)
核心組態
SPs:TMUs:ROPs[a]
光追
核心
張量
核心
二級
暫存

(MB)
預設
(MHz)
加速
(MHz)
記憶體
(MT/s)
像素
(GP/s)
材質
(GT/s)
容量
(GB)
頻寬
(GB/s)
類型 介面
頻寬
(位元)
單精度
(加速)
雙精度
(加速)
半精度
(加速)
張量
浮點
零售版 創始版
GeForce RTX
2060
2019年
1月15日
TU106-
200A-
KA-A1
12 108億
445mm2
1920:120:48
(30 SM)
30 240 3 1365 1680 14000 65.52 163.8 6 336 GDDR6 192 5.24
(6.45)
0.16
(0.20)
10.5
(12.9)
51.6 5 PCIe
3.0
x16
160 $349
GeForce RTX
2060 TU104
2020年
1月10日
TU104-
150-KC-
A1
136億
545mm2
$300
GeForce RTX
2060 Super
2019年
7月9日
TU106-
410-
A1
108億
445mm2
2176:136:64
(34 SM)
34 272 4 1470 1650 90.5 191.4 8 448 256 6.12
(7.18)
0.19
(0.22)
12.2
(14.4)
57.4 6 175 $399
GeForce RTX
2070
2018年
10月17日
TU106-
400-A1
2304:144:64
(36 SM)
36 288 1410 1620 90.24 203.04 6.50
(7.47)
0.20
(0.23)
12.3
(14.9)
59.7 $499 不適用
TU106-
400A-A1
1620+ $499+ $599
GeForce RTX
2070 Super
2019年
7月9日
TU104-
410-A1
136億
545mm2
2560:160:64
(40 SM)
40 320 1605 1770 102.72 256.8 8.22
(9.06)
0.26
(0.28)
16.4
(18.1)
72.5 7 215 2路
NVLink
$499
GeForce RTX
2080
2018年
9月20日
TU104-
400-A1
2944:184:64
(46 SM)
46 368 1515 1710 96.96 278.76 8.92
(10.1)
0.28
(0.32)
17.8
(20.1)
80.5 8 $699 不適用
TU104-
400A-A1
1710+ $699+ $799
GeForce RTX
2080 Super
2019年
7月23日
TU104-
450-A1
3072:192:64
(48 SM)
48 384 1650 1815 15500 105.6 316.8 496 10.1
(11.2)
0.32
(0.35)
20.3
(22.3)
89.2 250 $699
GeForce RTX
2080 Ti
2018年
9月27日
TU102-
300-K1-
A1
186億
754mm2
4352:272:88
(68 SM)
68 544 5.5 1350 1545 14000 118.8 367.2 11 616 352 11.8
(13.4)
0.37
(0.42)
23.5
(26.9)
107.6 10 $999 不適用
TU102-
300A-K1-
A1
1545+ $999+ $1,199
NVIDIA Titan
RTX
2018年
12月18日
TU102-
400-A1
4608:288:96
(72 SM)
72 576 6 1770 129.6 388.8 24 672 384 12.4
(16.3)
0.39
(0.51)
24.9
(32.6)
130.5 11 280 $2,499
  1. ^ 流處理器數量 : 紋理映射單元數量 : 渲染輸出單元數量

另見

編輯

參見

編輯
  1. ^ GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21]. (原始內容存檔於2018-08-20) (英語). 
  2. ^ Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始內容存檔於2018-08-20) (美國英語). 
  3. ^ Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. (原始內容存檔於2018-08-20). 
  4. ^ Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始內容存檔於2018-08-20) (美國英語). 
  5. ^ Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. (原始內容存檔於2018-08-20). 
  6. ^ GeForce RTX 2080 即可享受 4K HDR 60FPS 遊戲效能,DLSS 反鋸齒效能再增加 1 倍. techbang.com. 2018-08-24 [2018-10-08]. (原始內容存檔於2018-10-09) (中文(臺灣)). 
  7. ^ 新增 RT 與 Tensor ,NVIDIA GeForce RTX 2080/2080Ti Turing 架構、Founders Edition、效能表現一次看懂. techbang.com. 2018-09-19 [2018-10-08]. (原始內容存檔於2018-10-09) (中文(臺灣)). 
  8. ^ The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. [2018-10-08]. (原始內容存檔於2018-09-15). 
  9. ^ NVIDIA RTX™ platform. Nvidia. [2018-08-21]. (原始內容存檔於2018-08-24). 

擴展鏈接

編輯