图灵微架构

Nvidia Turing
发布日期	2018年9月20日
制造工艺	台积电 12 nm (FinFET)
历史
前代产品	帕斯卡（消费）; 伏打（专业）;
后继产品	安培

图灵微架构（英语：Turing microarchitecture），是由英伟达公司（nVIDIA）所开发的一种GPU 微架构，用以取代伏打微架构（Volta microarchitecture）。命名为“图灵”以向英国计算机科学家艾伦·图灵（Alan Turing）致敬。这个微架构于 2018 年 8 月在 SIGGRAPH 2018 年会上首次在面向工作站的 Quadro RTX 卡中推出^[2]，并于一周后在科隆游戏展(Gamescom)上在消费类 GeForce RTX 20 系列显示卡中推出^[3]。图灵微架构以其 HPC 专有前身的前期工作为基础，推出了首款能够实现即时光线追踪的消费产品，这是电脑绘图产业的长期目标。关键要素包括专用人工智能处理器（"Tensor cores"）和专用光线追踪处理器（"RT Cores"）。图灵微架构利用 DXR、OptiX 和 Vulkan 来存取光线追踪。 2019年2月，Nvidia发表了NVIDIA GeForce 16系列GPU，采用了新的图灵设计，但缺乏光线追踪（RT）和张量（Tensor）核心。

图灵微架构采用台积电的 12 nm FinFET 半导体制造制程。高阶 TU102 GPU 包括使用此制程制造的 186 亿个电晶体。图灵微架构也使用三星电子 (Samsung Electronics) 和先前的美光科技 (Micron Technology) 的 GDDR6 记忆体。

细节信息

RTX 2080 卡中使用的 TU104 GPU 的芯片拍摄图

RTX 2060 卡中使用的 TU106 GPU 的芯片拍摄图

RTX 1660 卡中使用的 TU116 GPU 的芯片拍摄图

图灵微架构结合了多种类型的专用处理器核心，并实现了实时光线追踪技术（尽管大多数仍限于对物理建模的材质、室内反射和照明）^[4]。这得益于新的 RT 核心的使用，这些核心被设计用于处理四叉树和球形层次结构，并为单个三角形的碰撞测试提速。

图灵微架构的特性包括：

CUDA 核心（流式多处理器）
- 计算能力（Compute Capability）：7.5
- 传统的栅格化着色器和计算
- 整数和浮点操作的并行执行（继承自伏打微架构）
光线追踪（RT）核心
- 层次包围体结构（Bounding Volume Hierarchy）加速^[5]
- 阴影、环境光遮蔽、照明、反射
张量（AI 中的 Tensor）核心^[6]
- 人工智能
- 大型矩阵操作
- 深度学习超级采样（DLSS）
GDDR6/HBM2 支持的内存控制器
带有显示压缩流（DSC 1.2）技术的 1.4a 版本 DisplayPort 接口
支持使用 PureVideo 技术的 Feature Set J 来进行硬件加速的视频解码
GPU Boost 4
支持通过 NVLink Bridge 实现多个显卡的连接，并使用 VRAM 堆叠的方式汇集多个显卡的内存
VirtualLink 标准虚拟现实
NVENC（NVIDIA Encoder）硬件编码引擎

GDDR6 内存由三星电子为 Quadro RTX 系列生产^[7]。RTX 20 系列在最初发布时使用美光的内存芯片，在 2018 年 11 月换为三星芯片^[8]。

栅格化（Rasterization）

NVIDIA 报告称，在现有的软件标题中，栅格化（使用 CUDA 技术）的性能相较于前一代提升了大约 30-50%^[9]^[10]。这表示图灵架构的 NVIDIA GPU 在处理现有软件时，通过栅格化技术取得了相当可观的性能提升，提高了图形处理的效率。

光线追踪（Ray-tracing）

RT 核心执行的光线追踪可用于生成反射、折射和阴影，从而取代一些传统的栅格技术，如立方体贴图（Cube maps）和深度贴图（Depth maps）。需要注意的是，光线追踪技术并非完全替代栅格化技术，光线追踪收集到的信息可以用于增强着色，使图像更加写实，特别是在处理摄像机视野之外发生的动作（off-camera action）时。NVIDIA 表示，光线追踪性能相较上一代消费者架构 Pascal 提高了约 8 倍。

张量核心（Tensor cores）

利用张量核心，最终图像的生成能够得到进一步加速，这些核心用于填充部分渲染图像中的空白，这一技术被称为去噪（de-noising）。张量核心负责执行深度学习的结果运算结果，对处理特定任务的方法进行编码，使得系统能够理解和应用这些方法。这种编码过程使得系统能够更有效地执行某些任务，例如增加特定应用程序或游戏生成图像的分辨率。在张量核心的主要用途中，需要解决的问题会在超级计算机上进行分析，该计算机通过示例学习期望的结果，确定实现这些结果的方法，随后，这些方法通过驱动程序更新传递给消费者，最终由消费者的张量核心执行操作^[9]。超级计算机本身使用了大量的张量核心。

图灵晶粒（Turing dies）

图灵晶粒的对比
晶粒	TU102	TU104	TU106	TU116	TU117
晶粒大小	754 mm²	545 mm²	445 mm²	284 mm²	200 mm²
晶体管数量	18.6B	13.6B	10.8B	6.6B	4.7B
晶体管密度	24.7 MTr/mm²	25.0 MTr/mm²	24.3 MTr/mm²	23.2 MTr/mm²	23.5 MTr/mm²
图形处理集群 (GPC)	6	6	3	3	2
流处理多处理器 (SM)	72	48	36	24	16
CUDA核心数	4608	3072	2304	1536	1024
纹理映射单元 (TMU)	288	192	144	96	64
渲染输出单元 (ROP)	96	64	64	48	32
张量核心	576	384	288	不适用
光线追踪核心	72	48	36	不适用
L1 缓存	6.75 MB	4.5 MB	3.375 MB	2.25 MB	1.5 MB
L1 缓存	96 KB per SM
L2 缓存	6 MB	4 MB	4 MB	1.5 MB	1 MB
最大热设计功耗 (Max TDP)	280 W	250 W	185 W	125 W	75 W

开发

图灵微架构的开发平台是 RTX。可以通过 Microsoft 的 DXR（DirectX Raytracing），OptiX, 以及使用 Vulkan 拓展（最后者在 Linux 驱动上也可以使用）来调用 RTX 的光线追踪功能^[11]。AI 加速功能可以通过 NGX 集成到应用程序中^[12]。网格着色器（Mesh Shader）和着色率图像（Shading Rate Image）功能可以在 Windows 和 Linux 平台上使用 DX12、Vulkan 和 OpenGL 扩展来访问^[13]。

Windows 10 在 2018 年 10 月的更新中包括了 DirectX 光线追踪的公开发布^[14]^[15]。

采用图灵微架构的产品

GeForce MX 系列
- GeForce MX450 (Mobile)
- GeForce MX550 (Mobile)
GeForce 16 系列
- GeForce GTX 1630
- GeForce GTX 1650 (Mobile)
- GeForce GTX 1650
- GeForce GTX 1650 Super
- GeForce GTX 1650 Ti (Mobile)
- GeForce GTX 1660
- GeForce GTX 1660 Super
- GeForce GTX 1660 Ti (Mobile)
- GeForce GTX 1660 Ti
GeForce 20 系列
- GeForce RTX 2060 (Mobile)
- GeForce RTX 2060
- GeForce RTX 2060 Super
- GeForce RTX 2070 (Mobile)
- GeForce RTX 2070
- GeForce RTX 2070 Super (Mobile)
- GeForce RTX 2070 Super
- GeForce RTX 2080 (Mobile)
- GeForce RTX 2080
- GeForce RTX 2080 Super (Mobile)
- GeForce RTX 2080 Super
- GeForce RTX 2080 Ti
- Titan RTX
Nvidia Quadro
- Quadro RTX 3000 (Mobile)
- Quadro RTX 4000 (Mobile)
- Quadro RTX 4000
- Quadro RTX 5000 (Mobile)
- Quadro RTX 5000
- Quadro RTX 6000 (Mobile)
- Quadro RTX 6000
- Quadro RTX 8000
- Quadro T1000 (Mobile)
- Quadro T2000 (Mobile)
- T400
- T400 4GB
- T500 (Mobile)
- T600 (Mobile)
- T600
- T1000
- T1000 8GB
- T1200 (Mobile)
Nvidia Tesla
- Tesla T4

参考资料

^ Tom Warren; James Vincent. Nvidia’s first Ampere GPU is designed for data centers and AI, not your PC. The Verge. May 14, 2020 [2020-10-21]. （原始内容存档于2020-12-08）. New “RTX 3080” cards could be just months away then, but we still don’t know for sure if they’ll be using this new Ampere architecture.
^ Smith, Ryan. NVIDIA Reveals Next-Gen Turing GPU Architecture: NVIDIA Doubles-Down on Ray Tracing, GDDR6, & More. AnandTech. August 13, 2018 [April 9, 2023]. （原始内容存档于2020-04-24）（美国英语）.
^ Smith, Ryan. NVIDIA Announces the GeForce RTX 20 Series: RTX 2080 Ti & 2080 on Sept. 20th, RTX 2070 in October. AnandTech. August 20, 2018 [April 9, 2023]. （原始内容存档于2018-08-21）（美国英语）.
^ Warren, Tom. Nvidia announces RTX 2000 GPU series with '6 times more performance' and ray-tracing. The Verge. August 20, 2018 [August 20, 2018]. （原始内容存档于2018-08-20）（美国英语）.
^ Oh, Nate. The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. September 14, 2018 [April 9, 2023]. （原始内容存档于2024-05-12）（美国英语）.
^ TENSOR CORE DL PERFORMANCE GUIDE (PDF). Nvidia. （原始内容存档 (PDF)于2020-11-11）.
^ Mujtaba, Hassan. Samsung GDDR6 Memory Powers NVIDIA's Turing GPU Based Quadro RTX Cards. Wccftech. August 14, 2018 [April 9, 2023] （美国英语）.
^ Maislinger, Florian. Faulty RTX 2080 Ti: Nvidia switches from Micron to Samsung for GDDR6 memory. PC Builder's Club. November 21, 2018 [July 15, 2019].
^ ^9.0 ^9.1 #BeForTheGame. Twitch. [2024-01-12]. （原始内容存档于2023-03-30）（美国英语）.
^ Fisher, Jeff. GeForce RTX Propels PC Gaming's Golden Age with Real-Time Ray Tracing. Nvidia. August 20, 2018 [April 9, 2023] （美国英语）.
^ NVIDIA RTX platform. Nvidia. July 20, 2018 [April 9, 2023]. （原始内容存档于2018-03-31）（美国英语）.
^ NVIDIA NGX. NVIDIA Docs. February 14, 2023 [2024-01-12]. （原始内容存档于2024-04-16）（英语）.
^ Turing Extensions for Vulkan and OpenGL. Nvidia. September 11, 2018 [April 9, 2023] （美国英语）.
^ Pelletier, Sean. Windows 10 October 2018 Update a Catalyst for Ray-Traced Games. Nvidia. October 2, 2018 [April 9, 2023]. （原始内容存档于2023-09-22）（美国英语）.
^ van Rhyn, Jacques. DirectX Raytracing and the Windows 10 October 2018 Update. Microsoft. October 2, 2018 [April 9, 2023] （美国英语）.

外部链接

（英文）Nvidia Turing GPU Architecture Whitepaper（页面存档备份，存于互联网档案馆）
（繁体中文）Nvidia page about Turing（页面存档备份，存于互联网档案馆）
（英文）Nvidia blog about raytracing vs. rasterization（页面存档备份，存于互联网档案馆）
（英文）NVIDIA Turing Architecture In-Depth（页面存档备份，存于互联网档案馆）
（英文）Microsoft developer blog on DirectX Raytracing（页面存档备份，存于互联网档案馆）

这是一篇与计算机相关的小作品。您可以通过编辑或修订扩充其内容。

[verge-A100-1] Tom Warren; James Vincent. Nvidia’s first Ampere GPU is designed for data centers and AI, not your PC. The Verge. May 14, 2020 [2020-10-21]. （原始内容存档于2020-12-08）. New “RTX 3080” cards could be just months away then, but we still don’t know for sure if they’ll be using this new Ampere architecture.

[2] Smith, Ryan. NVIDIA Reveals Next-Gen Turing GPU Architecture: NVIDIA Doubles-Down on Ray Tracing, GDDR6, & More. AnandTech. August 13, 2018 [April 9, 2023]. （原始内容存档于2020-04-24）（美国英语）.

[3] Smith, Ryan. NVIDIA Announces the GeForce RTX 20 Series: RTX 2080 Ti & 2080 on Sept. 20th, RTX 2070 in October. AnandTech. August 20, 2018 [April 9, 2023]. （原始内容存档于2018-08-21）（美国英语）.

[4] Warren, Tom. Nvidia announces RTX 2000 GPU series with '6 times more performance' and ray-tracing. The Verge. August 20, 2018 [August 20, 2018]. （原始内容存档于2018-08-20）（美国英语）.

[anandarch-5] Oh, Nate. The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. September 14, 2018 [April 9, 2023]. （原始内容存档于2024-05-12）（美国英语）.

[6] TENSOR CORE DL PERFORMANCE GUIDE (PDF). Nvidia. （原始内容存档 (PDF)于2020-11-11）.

[7] Mujtaba, Hassan. Samsung GDDR6 Memory Powers NVIDIA's Turing GPU Based Quadro RTX Cards. Wccftech. August 14, 2018 [April 9, 2023] （美国英语）.

[8] Maislinger, Florian. Faulty RTX 2080 Ti: Nvidia switches from Micron to Samsung for GDDR6 memory. PC Builder's Club. November 21, 2018 [July 15, 2019].

[Keynote-9] 9.0 ^9.1 #BeForTheGame. Twitch. [2024-01-12]. （原始内容存档于2023-03-30）（美国英语）.

[fisher-10] Fisher, Jeff. GeForce RTX Propels PC Gaming's Golden Age with Real-Time Ray Tracing. Nvidia. August 20, 2018 [April 9, 2023] （美国英语）.

[nvidiartx-11] NVIDIA RTX platform. Nvidia. July 20, 2018 [April 9, 2023]. （原始内容存档于2018-03-31）（美国英语）.

[12] NVIDIA NGX. NVIDIA Docs. February 14, 2023 [2024-01-12]. （原始内容存档于2024-04-16）（英语）.

[13] Turing Extensions for Vulkan and OpenGL. Nvidia. September 11, 2018 [April 9, 2023] （美国英语）.

[14] Pelletier, Sean. Windows 10 October 2018 Update a Catalyst for Ray-Traced Games. Nvidia. October 2, 2018 [April 9, 2023]. （原始内容存档于2023-09-22）（美国英语）.

[15] van Rhyn, Jacques. DirectX Raytracing and the Windows 10 October 2018 Update. Microsoft. October 2, 2018 [April 9, 2023] （美国英语）.

[2]

[3]

[1]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

历史

发布日期	2018年9月20日 (2018-09-20)
制造工艺	台积电 12 nm (FinFET)
前代产品	帕斯卡（消费）伏打（专业）
后继产品	安培^[1]