NVIDIA GeForce 20系列
此條目翻譯品質不佳。 (2018年9月7日) |
NVIDIA GeForce RTX 20系列,是由NVIDIA繼GeForce GTX 10系列後開發的圖形處理器系列。於2018年8月20日的Gamescom(科隆遊戲展)上發布。[1][2][3]本系列首發產品是GeForce RTX 2080及2080Ti,2018年9月20日正式發售[4]。此系列產品新命名為RTX,而未沿用推出多年的GTX,以突顯支援光線跟蹤的特色。
發布日期 | 2018年9月20日 2019年7月9日 (Super系列) |
---|---|
代號 | TU10x |
架構 | Turing |
產品系列 | GeForce RTX |
電晶體 |
|
製造工藝 | 台積電 12nm(FinFET) |
顯示卡 | |
中端GPU | GeForce RTX 2050 GeForce RTX 2060 GeForce RTX 2060 Super |
高端GPU | GeForce RTX 2070 GeForce RTX 2070 Super GeFroce RTX 2080 GeForce RTX 2080 Super |
旗艦GPU | GeForce RTX 2080 Ti NVIDIA TITAN RTX |
API支持 | |
Direct3D | Direct3D 12 (12_2) |
OpenGL | OpenGL 4.6 |
OpenCL | OpenCL 1.2 |
Vulkan | Vulkan 1.2 |
歷史 | |
前代產品 | GeForce 10系列 |
相關產品 | GeForce 16系列 |
後繼產品 | GeForce 30系列 |
架構特性
編輯RTX 20系列基於圖靈微架構(Turing),具有實時光線跟蹤(Ray tracing)功能。[5]通過使用RT核心(光線追蹤運算核心)可以加速這一過程。這些核心能夠高效處理四叉樹和球形層次結構,並在碰撞模擬的過程中更快地為三角面組成的立體模型進行物體碰撞模擬。
RT核心的光線追蹤功能在模擬反射、折射和陰影的操作上可以取代傳統立方體貼圖和深度貼圖的光柵技術。從光線追蹤運算得到的信息可以增強陰影使畫面更加逼真,尤其是可以將發生於屏幕畫面以外的動作通過陰影和光線反射渲染到畫面之中。
張量運算核心(Tensor Core)進一步加速了光線追蹤,並用於填充部分渲染圖像中的空白,這種技術被稱為「降噪」。張量核心原是為深度學習而設計的,例如學習如何提高圖像的分辨率。但通常消費者的張量核心主要是執行一些已經完成的深度學習模型,這些模型是在超級計算機進行分析和解決的,超級計算機確定如何實現這些目標的方法,例如學習如何提高圖像的分辨率,然後由消費者的張量核心實際使用這個方法,也就是使用超級計算機找到的方法來提高圖像的分辨率。
因此,圖靈架構的光線追蹤特性,實際上是舊有光線追蹤技術與近年興起的人工智慧(AI)、深度學習結合的產物,先是利用光線追蹤專用的運算單元RT core生成圖像的關鍵要素,剩餘的非關鍵要素則是交由深度學習運算單元Tensor Core來補全,而圖像中的關鍵要素,也藉由Tensor Core執行相關的深度學習程式來決定。除此以外,Tensor Core還被用於執行消除混疊的深度學習程式(深度學習超級採樣,DLSS),來柔化畫面鋸齒邊緣。[6]
將深度學習、光線追蹤用於畫面運算雖然不是首個,NVIDIA早在基於帕斯卡、伏打圖形處理微架構的GeForce GTX TITAN系列上有先行鋪路,光線追蹤更是早已有之的技術,只是當時裝置的效能僅能到作生成靜態畫面之用,而本代GeForce RTX系列則是首個在畫面處理中大量使用深度學習技術、引入與深度學習相結合的光線追蹤實時動態畫面技術的圖形處理器。不過它仍然保留了效能強勁、規格龐大的傳統光柵化渲染3D畫面所需的運算組件。[7]
細節
編輯- 採用台積電12nm FFN製程打造,由伏特微架構使用的12nm FFC製程改進(但本質上依舊是台積電16nm FF+製程的延伸版本),性能是後者的1.1倍,功耗只有後者的70%,核心面積則可以縮小20%
- 為容納數量龐大的運算單元,核心面積相比帕斯卡微架構的大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm 2
- CUDA 7.5
- 採用全新的SM陣列設計: TPC包含了兩個SM單元(Pascal為1個),SM單元重新分配為64個FP32、64個INT32、8個Tensor Core 、1個RT Core ,同時添加了獨立的INT數據路徑,支援FP32和INT32操作的並發執行。
- 為共享暫存、一級暫存、紋理暫存引入了統一架構,一級暫存與共享暫存大小是靈活可變的,可以根據需要在64+32KB或者32+64KB之間變換,讓一級暫存更充分利用資源,也減少一級暫存延遲,並提供比Pascal GPU中使用的一級暫存更高的頻寬,同時二級暫存容量提升。
- Tensor Core(張量核心) : 負責人工智慧、神經網路運算,增加了新的INT8和INT4精度模式,FP16半精度也能夠被完整支援通常會用到矩陣融合乘加(FMA)運算,新的INT8精度模式的工作速率是此速率的兩倍,張量核心為矩陣運算提供了顯著的加速,除了新的神經圖形功能外,還用於深度學習訓練和推理操作。
- NGX (Neural Graphics Acceleration)框架: 利用張量核心,在遊戲中實現深度學習功能,GeForce Experience會自動匹配Turing顯卡並且下載可用的NGX Core軟件包,對應如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
- DLSS (深度學習超級採樣) : 反鋸齒技術,利用張量核心實現在較低的輸入樣本數下更快地渲染,具有與64×超級採樣畫面相同品質的細節,還可以避免TAA產生的運動模糊等問題,相比TAA等其它反鋸齒技術,渲染能力得到大幅提升。
- AI InPainting : 算法利用大量真實世界圖像的訓練,可以補全圖片中缺失的內容,也可以移除照片的噪點、失真部分以及增強照片的清晰度等功能。
- AI Super Rez : 將原影片的解析度清晰地放大2倍、4倍、8倍,圖像更加銳利。
- AI Slow-Mo : 將普通常見的30fps進行智慧補幀計算,可以獲得240/480fps的慢動作影片,而不需要專門高幀率攝影機。
- RT Core : 專門為光線追蹤計算,是一條特異化的專用流水線,用於加速計算邊界體積層次(BVH)遍歷以及光線和三角求交(光線投射)。
- GDDR6顯示記憶體的支援
- 附有影像串流壓縮技術(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
- 功能集PureVideo的硬體加速視訊解碼
- NVLink連接器(與伏打微架構的不相容)
- VirtualLink VR
- GPU Boost 4[8]
設計
編輯RTX是GeForce 20系列引入的開發平台。RTX的光線追蹤示範程序中使用了微軟的DXR,OptiX和Vulkan來進行光線追蹤。[9]
芯片規格
編輯型號 | 推出日期 | 核心 代號 |
製程 (nm) |
晶體管數 & 晶粒面積 |
核心配置 | 時脈頻率 | 填充率 | 顯示記憶體 | 運算性能 (TFLOPS) | 每秒 光線數 (十億) |
匯流排 介面 |
TDP (W) |
NVLink 支援 |
發售價格(美金) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
核心組態 SPs:TMUs:ROPs[a] |
光追 核心 |
張量 核心 |
二級 暫存 (MB) |
預設 (MHz) |
加速 (MHz) |
記憶體 (MT/s) |
像素 (GP/s) |
材質 (GT/s) |
容量 (GB) |
頻寬 (GB/s) |
類型 | 介面 頻寬 (位元) |
單精度 (加速) |
雙精度 (加速) |
半精度 (加速) |
張量 浮點 |
零售版 | 創始版 | |||||||||
GeForce RTX 2060 |
2019年 1月15日 |
TU106- 200A- KA-A1 |
12 | 108億 445mm2 |
1920:120:48 (30 SM) |
30 | 240 | 3 | 1365 | 1680 | 14000 | 65.52 | 163.8 | 6 | 336 | GDDR6 | 192 | 5.24 (6.45) |
0.16 (0.20) |
10.5 (12.9) |
51.6 | 5 | PCIe 3.0 x16 |
160 | 否 | $349 | |
GeForce RTX 2060 TU104 |
2020年 1月10日 |
TU104- 150-KC- A1 |
136億 545mm2 |
$300 | |||||||||||||||||||||||
GeForce RTX 2060 Super |
2019年 7月9日 |
TU106- 410- A1 |
108億 445mm2 |
2176:136:64 (34 SM) |
34 | 272 | 4 | 1470 | 1650 | 90.5 | 191.4 | 8 | 448 | 256 | 6.12 (7.18) |
0.19 (0.22) |
12.2 (14.4) |
57.4 | 6 | 175 | $399 | ||||||
GeForce RTX 2070 |
2018年 10月17日 |
TU106- 400-A1 |
2304:144:64 (36 SM) |
36 | 288 | 1410 | 1620 | 90.24 | 203.04 | 6.50 (7.47) |
0.20 (0.23) |
12.3 (14.9) |
59.7 | $499 | 不適用 | ||||||||||||
TU106- 400A-A1 |
1620+ | $499+ | $599 | ||||||||||||||||||||||||
GeForce RTX 2070 Super |
2019年 7月9日 |
TU104- 410-A1 |
136億 545mm2 |
2560:160:64 (40 SM) |
40 | 320 | 1605 | 1770 | 102.72 | 256.8 | 8.22 (9.06) |
0.26 (0.28) |
16.4 (18.1) |
72.5 | 7 | 215 | 2路 NVLink |
$499 | |||||||||
GeForce RTX 2080 |
2018年 9月20日 |
TU104- 400-A1 |
2944:184:64 (46 SM) |
46 | 368 | 1515 | 1710 | 96.96 | 278.76 | 8.92 (10.1) |
0.28 (0.32) |
17.8 (20.1) |
80.5 | 8 | $699 | 不適用 | |||||||||||
TU104- 400A-A1 |
1710+ | $699+ | $799 | ||||||||||||||||||||||||
GeForce RTX 2080 Super |
2019年 7月23日 |
TU104- 450-A1 |
3072:192:64 (48 SM) |
48 | 384 | 1650 | 1815 | 15500 | 105.6 | 316.8 | 496 | 10.1 (11.2) |
0.32 (0.35) |
20.3 (22.3) |
89.2 | 250 | $699 | ||||||||||
GeForce RTX 2080 Ti |
2018年 9月27日 |
TU102- 300-K1- A1 |
186億 754mm2 |
4352:272:88 (68 SM) |
68 | 544 | 5.5 | 1350 | 1545 | 14000 | 118.8 | 367.2 | 11 | 616 | 352 | 11.8 (13.4) |
0.37 (0.42) |
23.5 (26.9) |
107.6 | 10 | $999 | 不適用 | |||||
TU102- 300A-K1- A1 |
1545+ | $999+ | $1,199 | ||||||||||||||||||||||||
NVIDIA Titan RTX |
2018年 12月18日 |
TU102- 400-A1 |
4608:288:96 (72 SM) |
72 | 576 | 6 | 1770 | 129.6 | 388.8 | 24 | 672 | 384 | 12.4 (16.3) |
0.39 (0.51) |
24.9 (32.6) |
130.5 | 11 | 280 | $2,499 |
另見
編輯參見
編輯- ^ GeForce RTX 2080 launch live blog: Nvidia's Gamescom press conference as it happens. TechRadar. [2018-08-21]. (原始內容存檔於2018-08-20) (英語).
- ^ Nvidia’s new RTX 2080, 2080 Ti video cards ship on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始內容存檔於2018-08-20) (美國英語).
- ^ Nvidia unveils powerful new RTX 2070, RTX 2080, RTX 2080 Ti graphics cards. Polygon. [2018-08-20]. (原始內容存檔於2018-08-20).
- ^ Nvidia’s new RTX 2080, 2080 Ti video cards shipped on Sept 20, starting at $799. Ars Technica. [2018-08-20]. (原始內容存檔於2018-08-20) (美國英語).
- ^ Nvidia announces RTX 2000 GPU series with ‘6 times more performance’ and ray-tracing. The Verge. [2018-08-20]. (原始內容存檔於2018-08-20).
- ^ GeForce RTX 2080 即可享受 4K HDR 60FPS 遊戲效能,DLSS 反鋸齒效能再增加 1 倍. techbang.com. 2018-08-24 [2018-10-08]. (原始內容存檔於2018-10-09) (中文(臺灣)).
- ^ 新增 RT 與 Tensor ,NVIDIA GeForce RTX 2080/2080Ti Turing 架構、Founders Edition、效能表現一次看懂. techbang.com. 2018-09-19 [2018-10-08]. (原始內容存檔於2018-10-09) (中文(臺灣)).
- ^ The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. [2018-10-08]. (原始內容存檔於2018-09-15).
- ^ NVIDIA RTX™ platform. Nvidia. [2018-08-21]. (原始內容存檔於2018-08-24).
擴展鏈接
編輯- 官方網站
- Nvidia Nsight(頁面存檔備份,存於網際網路檔案館)
- Nvidia Turing GPU Architecture: Graphics Reinvented (PDF). Nvidia. Nvidia Corporation. [2018-10-25]. (原始內容存檔 (PDF)於2018-09-24) (英語).