图灵微架构
图灵微架构(英语:Turing microarchitecture),是由英伟达公司(nVIDIA)所开发的一种GPU微架构,用以取代伏打微架构(Volta microarchitecture)。命名为“图灵”以向英国计算机科学家艾伦·图灵(Alan Turing)致敬。这个微架构于 2018 年 8 月在 SIGGRAPH 2018 年会上首次在面向工作站的 Quadro RTX 卡中推出[2], 并于一周后在 科隆游戏展(Gamescom)上在消费类 GeForce RTX 20 系列显示卡中推出[3]。图灵微架构以其 HPC 专有前身的前期工作为基础,推出了首款能够实现即时光线追踪的消费产品,这是电脑绘图产业的长期目标。关键要素包括专用人工智能处理器("Tensor cores")和专用光线追踪处理器("RT Cores")。 图灵微架构利用 DXR、OptiX 和 Vulkan 来存取光线追踪。 2019年2月,Nvidia发表了NVIDIA GeForce 16系列GPU,采用了新的图灵设计,但缺乏光线追踪(RT)和张量(Tensor)核心。
发布日期 | 2018年9月20日 |
---|---|
制造工艺 | 台积电 12 nm (FinFET) |
历史 | |
前代产品 | |
后继产品 | 安培[1] |
图灵微架构采用台积电的 12 nm FinFET 半导体制造制程。 高阶 TU102 GPU 包括使用此制程制造的 186 亿个电晶体。 图灵微架构也使用三星电子 (Samsung Electronics) 和先前的美光科技 (Micron Technology) 的 GDDR6 记忆体。
细节信息
编辑图灵微架构结合了多种类型的专用处理器核心,并实现了实时光线追踪技术(尽管大多数仍限于对物理建模的材质、室内反射和照明)[4]。这得益于新的 RT 核心的使用,这些核心被设计用于处理四叉树和球形层次结构,并为单个三角形的碰撞测试提速。
图灵微架构的特性包括:
- CUDA 核心(流式多处理器)
- 计算能力(Compute Capability):7.5
- 传统的栅格化着色器和计算
- 整数和浮点操作的并行执行(继承自伏打微架构)
- 光线追踪(RT)核心
- 张量(AI 中的 Tensor)核心[6]
- GDDR6/HBM2 支持的内存控制器
- 带有显示压缩流(DSC 1.2)技术的 1.4a 版本 DisplayPort 接口
- 支持使用 PureVideo 技术的 Feature Set J 来进行硬件加速的视频解码
- GPU Boost 4
- 支持通过 NVLink Bridge 实现多个显卡的连接,并使用 VRAM 堆叠的方式汇集多个显卡的内存
- VirtualLink 标准虚拟现实
- NVENC(NVIDIA Encoder)硬件编码引擎
GDDR6 内存由三星电子为 Quadro RTX 系列生产[7]。RTX 20 系列在最初发布时使用美光的内存芯片,在 2018 年 11 月换为三星芯片[8]。
NVIDIA 报告称,在现有的软件标题中,栅格化(使用 CUDA 技术)的性能相较于前一代提升了大约 30-50%[9][10]。这表示图灵架构的 NVIDIA GPU 在处理现有软件时,通过栅格化技术取得了相当可观的性能提升,提高了图形处理的效率。
RT 核心执行的光线追踪可用于生成反射、折射和阴影,从而取代一些传统的栅格技术,如立方体贴图(Cube maps)和深度贴图(Depth maps)。需要注意的是,光线追踪技术并非完全替代栅格化技术,光线追踪收集到的信息可以用于增强着色,使图像更加写实,特别是在处理摄像机视野之外发生的动作(off-camera action)时。NVIDIA 表示,光线追踪性能相较上一代消费者架构 Pascal 提高了约 8 倍。
利用张量核心,最终图像的生成能够得到进一步加速,这些核心用于填充部分渲染图像中的空白,这一技术被称为去噪(de-noising)。张量核心负责执行深度学习的结果运算结果,对处理特定任务的方法进行编码,使得系统能够理解和应用这些方法。这种编码过程使得系统能够更有效地执行某些任务,例如增加特定应用程序或游戏生成图像的分辨率。在张量核心的主要用途中,需要解决的问题会在超级计算机上进行分析,该计算机通过示例学习期望的结果,确定实现这些结果的方法,随后,这些方法通过驱动程序更新传递给消费者,最终由消费者的张量核心执行操作[9]。超级计算机本身使用了大量的张量核心。
图灵晶粒(Turing dies)
编辑晶粒 | TU102 | TU104 | TU106 | TU116 | TU117 |
---|---|---|---|---|---|
晶粒大小 | 754 mm2 | 545 mm2 | 445 mm2 | 284 mm2 | 200 mm2 |
晶体管数量 | 18.6B | 13.6B | 10.8B | 6.6B | 4.7B |
晶体管密度 | 24.7 MTr/mm2 | 25.0 MTr/mm2 | 24.3 MTr/mm2 | 23.2 MTr/mm2 | 23.5 MTr/mm2 |
图形处理集群 (GPC) |
6 | 6 | 3 | 3 | 2 |
流处理多处理器 (SM) |
72 | 48 | 36 | 24 | 16 |
CUDA核心数 | 4608 | 3072 | 2304 | 1536 | 1024 |
纹理映射单元 (TMU) |
288 | 192 | 144 | 96 | 64 |
渲染输出单元 (ROP) |
96 | 64 | 64 | 48 | 32 |
张量核心 | 576 | 384 | 288 | 不适用 | |
光线追踪核心 | 72 | 48 | 36 | ||
L1 缓存 | 6.75 MB | 4.5 MB | 3.375 MB | 2.25 MB | 1.5 MB |
96 KB per SM | |||||
L2 缓存 | 6 MB | 4 MB | 4 MB | 1.5 MB | 1 MB |
最大热设计功耗 (Max TDP) |
280 W | 250 W | 185 W | 125 W | 75 W |
开发
编辑图灵微架构的开发平台是 RTX。可以通过 Microsoft 的 DXR(DirectX Raytracing),OptiX, 以及使用 Vulkan 拓展(最后者在 Linux 驱动上也可以使用)来调用 RTX 的光线追踪功能[11]。AI 加速功能可以通过 NGX 集成到应用程序中[12]。网格着色器(Mesh Shader)和着色率图像(Shading Rate Image)功能可以在 Windows 和 Linux 平台上使用 DX12、Vulkan 和 OpenGL 扩展来访问[13]。
采用图灵微架构的产品
编辑- GeForce MX 系列
- GeForce MX450 (Mobile)
- GeForce MX550 (Mobile)
- GeForce 16 系列
- GeForce GTX 1630
- GeForce GTX 1650 (Mobile)
- GeForce GTX 1650
- GeForce GTX 1650 Super
- GeForce GTX 1650 Ti (Mobile)
- GeForce GTX 1660
- GeForce GTX 1660 Super
- GeForce GTX 1660 Ti (Mobile)
- GeForce GTX 1660 Ti
- GeForce 20 系列
- GeForce RTX 2060 (Mobile)
- GeForce RTX 2060
- GeForce RTX 2060 Super
- GeForce RTX 2070 (Mobile)
- GeForce RTX 2070
- GeForce RTX 2070 Super (Mobile)
- GeForce RTX 2070 Super
- GeForce RTX 2080 (Mobile)
- GeForce RTX 2080
- GeForce RTX 2080 Super (Mobile)
- GeForce RTX 2080 Super
- GeForce RTX 2080 Ti
- Titan RTX
- Nvidia Quadro
- Quadro RTX 3000 (Mobile)
- Quadro RTX 4000 (Mobile)
- Quadro RTX 4000
- Quadro RTX 5000 (Mobile)
- Quadro RTX 5000
- Quadro RTX 6000 (Mobile)
- Quadro RTX 6000
- Quadro RTX 8000
- Quadro T1000 (Mobile)
- Quadro T2000 (Mobile)
- T400
- T400 4GB
- T500 (Mobile)
- T600 (Mobile)
- T600
- T1000
- T1000 8GB
- T1200 (Mobile)
- Nvidia Tesla
- Tesla T4
参考资料
编辑- ^ Tom Warren; James Vincent. Nvidia’s first Ampere GPU is designed for data centers and AI, not your PC. The Verge. May 14, 2020 [2020-10-21]. (原始内容存档于2020-12-08).
New “RTX 3080” cards could be just months away then, but we still don’t know for sure if they’ll be using this new Ampere architecture.
- ^ Smith, Ryan. NVIDIA Reveals Next-Gen Turing GPU Architecture: NVIDIA Doubles-Down on Ray Tracing, GDDR6, & More. AnandTech. August 13, 2018 [April 9, 2023]. (原始内容存档于2020-04-24) (美国英语).
- ^ Smith, Ryan. NVIDIA Announces the GeForce RTX 20 Series: RTX 2080 Ti & 2080 on Sept. 20th, RTX 2070 in October. AnandTech. August 20, 2018 [April 9, 2023]. (原始内容存档于2018-08-21) (美国英语).
- ^ Warren, Tom. Nvidia announces RTX 2000 GPU series with '6 times more performance' and ray-tracing. The Verge. August 20, 2018 [August 20, 2018]. (原始内容存档于2018-08-20) (美国英语).
- ^ Oh, Nate. The NVIDIA Turing GPU Architecture Deep Dive: Prelude to GeForce RTX. AnandTech. September 14, 2018 [April 9, 2023]. (原始内容存档于2024-05-12) (美国英语).
- ^ TENSOR CORE DL PERFORMANCE GUIDE (PDF). Nvidia. (原始内容存档 (PDF)于2020-11-11).
- ^ Mujtaba, Hassan. Samsung GDDR6 Memory Powers NVIDIA's Turing GPU Based Quadro RTX Cards. Wccftech. August 14, 2018 [April 9, 2023] (美国英语).
- ^ Maislinger, Florian. Faulty RTX 2080 Ti: Nvidia switches from Micron to Samsung for GDDR6 memory. PC Builder's Club. November 21, 2018 [July 15, 2019].
- ^ 9.0 9.1 #BeForTheGame. Twitch. [2024-01-12]. (原始内容存档于2023-03-30) (美国英语).
- ^ Fisher, Jeff. GeForce RTX Propels PC Gaming's Golden Age with Real-Time Ray Tracing. Nvidia. August 20, 2018 [April 9, 2023] (美国英语).
- ^ NVIDIA RTX platform. Nvidia. July 20, 2018 [April 9, 2023]. (原始内容存档于2018-03-31) (美国英语).
- ^ NVIDIA NGX. NVIDIA Docs. February 14, 2023 [2024-01-12]. (原始内容存档于2024-04-16) (英语).
- ^ Turing Extensions for Vulkan and OpenGL. Nvidia. September 11, 2018 [April 9, 2023] (美国英语).
- ^ Pelletier, Sean. Windows 10 October 2018 Update a Catalyst for Ray-Traced Games. Nvidia. October 2, 2018 [April 9, 2023]. (原始内容存档于2023-09-22) (美国英语).
- ^ van Rhyn, Jacques. DirectX Raytracing and the Windows 10 October 2018 Update. Microsoft. October 2, 2018 [April 9, 2023] (美国英语).
外部链接
编辑- (英文)Nvidia Turing GPU Architecture Whitepaper(页面存档备份,存于互联网档案馆)
- (繁体中文)Nvidia page about Turing(页面存档备份,存于互联网档案馆)
- (英文)Nvidia blog about raytracing vs. rasterization(页面存档备份,存于互联网档案馆)
- (英文)NVIDIA Turing Architecture In-Depth(页面存档备份,存于互联网档案馆)
- (英文)Microsoft developer blog on DirectX Raytracing(页面存档备份,存于互联网档案馆)
这是一篇与计算机相关的小作品。您可以通过编辑或修订扩充其内容。 |