NVIDIA GeForce 30系列

NVIDIA GeForce RTX 30系列NVIDIAGeForce RTX 20系列之后开发的图形处理器系列。于2020年9月1日正式发布,并于2020年9月17日开始发货[1]

GeForce RTX 30系列
GeForce RTX 3090 创始版
发布日期2020年9月17日,​3年前​(2020-09-17
代号GA10x
架构Ampere
产品系列GeForce RTX
电晶体
  • 133亿 (GA106)
  • 174亿 (GA104)
  • 283亿 (GA102)
制造工艺三星 8nm
显卡
中端GPUGeForce RTX 3050
GeForce RTX 3060
移动平台:
RTX 3050
RTX 3050Ti
RTX 3060
高端GPUGeForce RTX 3060 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti
移动平台:
RTX 3070
RTX 3070Ti
旗舰GPUGeForce RTX 3080
GeForce RTX 3080 Ti
GeForce RTX 3090
GeForce RTX 3090 Ti
移动平台:
RTX 3080
RTX 3080Ti
API支持
Direct3DDirect3D 12 Ultimate(12_2)
OpenGLOpenGL 4.6
OpenCLOpenCL 3.0
VulkanVulkan 1.3
历史
前代产品NVIDIA GeForce 20系列
后继产品NVIDIA GeForce 40系列

GeForce 30系列图形处理器基于安培微架构,拥有第二代光线追踪核心和第三代张量核心,Nvidia称其运行性能和能效约为之前图灵微架构图形处理器的两倍[1][2],使用三星电子8纳米工艺制造。

架构特性 编辑

在上一代图灵架构,引入了分数据类型计算的理念,将整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算,提高了SM单元的并发计算效率。不过现代游戏应用中最为常见的还是FP 32计算,INT 32 ALU的使用率比FP 32 ALU的低。为提升计算效率,新一代安培架构引入了可同时支持INT 32和FP 32两种数据类型的新ALU,取代了原本只支持INT 32计算的ALU。也就是说,现在有两条不同的数据路径(Datapath),一条能够处理整数或单精度浮点,另一条只能处理单精度浮点计算。原本整个SM单元同时可以处理64个INT 32计算指令和64个FP 32计算指令,安培上则是变成128个FP 32计算指令或64个INT 32计算指令和64个FP 32计算指令。为配合规模有一定扩张的计算单元,安培SM的共享缓存/L1数据缓存容量从96KB增长到了128KB,同时其带宽变为原来的两倍。

第二代RT Core 编辑

安培微架构的RT Core(Ray Tracing core,光线追踪核心)在图灵架构的基础上将三角形求交模块数量增加到两个(以并发方式运作),在基础的BVH计算上面,新一代RT Core也能够快上2倍。同时,第二代RT Core还增加了一个三角形位置内插模块,在允许BVH内的数据做少量更新的情况下,就能实现移动物体运动模糊效果的显著性能提升。在OptiX 7.0 中,开发人员可以为几何体指定特定的移动路径,让每条射线和时间关系起来,从而实现移动物体的所有运动模糊效果加速。

第三代Tensor Core 编辑

Tensor Core(张量核心)是专门针对深度学习加速设计的矩阵运算单元,可以执行基于深度学习的应用,例如光线追踪降噪和DLSS抗锯齿渲染。图灵中每个SM都配有8个Tensor Core(每个子核有两个Tensor Core),每个Clock(周期)可以执行512个FP16 Tensor操作。而在安培架构,每个SM里有4个Tensor Core(每个子核有一个Tensor Core),但是每个Tensor Core的处理能力倍增,因此每个SM也能执行512个FP16 Tensor操作。

第三代Tensor Core引入了BF16、TF32 两种新的数据格式,并引入硬件稀疏化技术,操作的能力上增加一倍达到等效每周期1024 个FP16 操作。

产品 编辑

型号 推出日期 核心代号 制程 晶体管数
&
晶粒面积
核心配置[a] 二级暂存(MB) 时钟频率 显示存储器 填充率 运算性能 (TFLOPS) 总线接口 TDP (W) NVLink支持 发售价格 (美金)
默认 (MHz) 加速 (MHz) 存储器 (MT/s) 容量 (GiB) 带宽 (GB/s) 类型 接口带宽 (bit) 像素 (GP/s) 材质 (GT/s) 单精度 双精度 半精度 张量 (FP16) 光追
GeForce RTX 3050 2022年1月27日 GA106-150-KA-A1 三星
8N
133亿

276mm2

2560:80:32:80:28
(20) (3)
2 1552 1777 14000 8 224 GDDR6 128 49.6
56.86
124.1
142.2
7.946
9.098
0.124
0.142
7.946
9.098
PCIe 4.0
x8
130 $249
GeForce RTX 3060[3] 2021年
2月25日
GA106-300-A1 3584:112:48:112:28
(28) (3)
3 1320 15000 12 360.0 192 63.4

85.3

147.8

199.0

9.46

12.74

0.148

0.199

9.46

12.74

25 PCIe 4.0

x16

170 $329
2021年
9月1日
GA104-150-A1[4] 174亿

392.5mm2

GeForce RTX 3060 Ti[5] 2020年
12月2日
GA104-200-A1 4864:152:80:152:38
(38) (6)
4 1410 1665 14000 8 448.0 256 112.8

133.2

214.3

253.1

13.72

16.20

0.214

0.253

13.70

16.20

?

129.6

32 200 $399
GeForce RTX 3070[6] 2020年
10月29日[7]
GA104-300-A1 5888:184:96:184:46
(46) (6)
1500 1725 144.0

165.6

276.0

317.4

17.66

20.31

0.276

0.318

17.66

20.37

141.31

162.98

40[8] 220 $499
GeForce RTX 3070 Ti[9] 2021年
6月10日
GA104-400-A1 6144:192:96:192:48
(48) (6)
1575 1770 9500 (19000)[b] 608.3 GDDR6X 151.18

169.9

302.36

339.8

19.35

21.75

0.302

0.340

19.35

21.75

290 $599
GeForce RTX 3080[10] 2020年
9月17日
GA102-200-KD-A1 283亿

628.4mm2

8704:272:96:272:68
(68) (7)
5 1440 1710 10 760.0 320 138.2

164.2

391.68

465.12

25.07

29.77

0.392

0.465

25.06

29.76

200.54

238.14

58 320 $699
GeForce RTX 3080 Ti[11] 2021年
6月3日
GA102-225-A1 10240:320:112:320:80
(80) (7)
6 1395 1665 12 912.4 384 153.5

186.5

438.5

532.8

28.57

34.71

0.438

0.533

28.06

34.10

350 $1199
GeForce RTX 3090[12] 2020年
9月24日
GA102-300-A1 10496:328:112:328:82
(82) (7)
1395 1695 9750 (19500)[b] 24 935.8 156.2

189.8

457.6

555.96

29.28

35.58

0.459

0.558

29.38

35.68

235.08

285.48

69[8] 350 2路 NVLink $1499
GeForce RTX 3090 Ti[13] 2022年

3月22日

GA102-350-A1 10752:336:112:336:84

(84)(7)

1560 1860 10500

(21000)

1008 174.7

208.3

524.1

625.0

33.54

39.99

0.524

0.625

33.54

39.99

320 450 $1999
  1. ^ 流处理器数量:纹理映射单元数量:渲染输出单元数量:张量核心数量:光线追踪核心数量(SM数量)(GPC数量)。面向非专业用途的Ampere架构中每个GPC由16个ROP及最多12个SM组成,每个SM固定包括128个流处理器(单精度浮点处理器)、64个32位长整型处理器、4个TMU、4个张量核心和1个光线追踪核心;GA100核心的浮点处理器配置则略有不同,参见NVIDIA Tesla
  2. ^ 2.0 2.1 类似于早已在闪存行业应用的MLC技术,GDDR6X一次访问可以操作两个比特,括号内用于比较GDDR6的等效传输速率

另见 编辑

参考文献 编辑

  1. ^ 1.0 1.1 GeForce Special Event. 英伟达. [September 1, 2020]. (原始内容存档于2020-09-02). 
  2. ^ Walton, Jarred. Nvidia GeForce RTX 3090 and GA102: Everything We Know. Tom's 硬件指南. August 31, 2020. 
  3. ^ NVIDIA GeForce RTX 3060 Graphics Card Announcement. [2021-01-12]. (原始内容存档于2022-02-26). 
  4. ^ Mujtaba, Hassan. Custom GALAX & Gainward GeForce RTX 3060 Cards With NVIDIA Ampere GA104 GPUs Listed. Wccftech. 2021-09-25 [2021-09-25]. (原始内容存档于2021-11-13) (美国英语). 
  5. ^ NVIDIA GeForce RTX 3060 Ti Graphics Card. [2020-12-01]. (原始内容存档于2021-01-12). 
  6. ^ NVIDIA GeForce RTX 3070 Graphics Card. [2020-09-06]. (原始内容存档于2021-05-14). 
  7. ^ GeForce RTX 3070 Availability Update. [2021-11-13]. (原始内容存档于2022-01-11). 
  8. ^ 8.0 8.1 Smith, Ryan. NVIDIA Announces the GeForce RTX 30 Series: Ampere For Gaming, Starting With RTX 3080 & RTX 3090. www.anandtech.com. [2020-09-02]. (原始内容存档于2022-01-12). 
  9. ^ NVIDIA GeForce RTX 3070 Family. [2021-06-02]. (原始内容存档于2022-02-26). 
  10. ^ NVIDIA GeForce RTX 3080 Graphics Card. [2020-09-06]. (原始内容存档于2021-05-19). 
  11. ^ NVIDIA GeForce RTX 3080 Family of Graphics Card. [2021-06-02]. (原始内容存档于2022-03-01). 
  12. ^ NVIDIA GeForce RTX 3090 Graphics Card. [2020-09-06]. (原始内容存档于2022-02-26). 
  13. ^ 3090 & 3090 Ti 顯示卡. www.nvidia.com. [2022-05-12]. (原始内容存档于2022-05-12) (中文(台湾)). 

外部链接 编辑