NVIDIA Tesla

(重定向自Nvidia Tesla

Tesla是一个NVIDIA显示核心系列品牌,主要用于服务器高性能电脑运算,用于对抗AMDFireStream系列。这是继GeForceQuadro之后,第三个显示核心商标。NVIDIA将显示核心分为三大系列。GeForce用于提供家庭娱乐;Quadro用于专业绘图设计;Tesla用于大规模的并联电脑运算。

Tesla
2007年开始使用的Tesla标志
研发者NVIDIA
生产日期2007年
类型图形处理器

Tesla以发明家尼古拉·特斯拉的名字命名。

产品系列

编辑
 
nVIDIA Tesla C870图形处理器

目前,Tesla有三个系列:

  • Tesla GPU运算处理器 - 外形与普通显卡大致相同,C870采用GeForce 8显示核心,而C1060采用GeForce 200显示核心,不设任何显示输出。
  • Tesla GPU Deskside Supercomputer - 桌面平台用,外形与QuadroPlex相似,D870包含两张C870运算处理器,可透过接线互联多个设备。Tesla 10系列中没有相关产品。
  • Tesla GPU Server - 服务器用,外形与1U服务器相似,S870包含四张C870运算处理器,而S1070包含四张C1060运算处理器,可透过接线互联多个设备。

较早的时候,人们已意识到GPU能运算大量数据。所以开发者通过图形语言,利用显示核心,来进行并行计算,亦即是GPGPU(通用绘图核心)。但开发者需要有一定程度的图形处理知识,才能发挥显示核心性能。随后,NVIDIA推出了CUDA。开发者利用C++语言,再通过CUDA编译器,就能利用显核运算。开发者可忽略图形处理技术,而直接利用熟悉的C++语言。开发者和科学家,就可以利用显示核心,研究物理生化勘探等领域。

Tesla比较专注于高性能运算,并且C1060以上(G200)系列能支持双精度浮点格式。另一方面,CUDA被所有的NVIDIA显示核心支持,包括GeForce和Quadro系列。

将来,显示核心能普及化地,辅助中央处理器,进行视频压缩数据库搜索等工作。并支持更多编程语言,例如FortranC++JAVAPython等。

完整型号列表

编辑
型号 微架构 发布时间 芯片 核心
频率
渲染器 内存 算力[a] CUDA
运算能力[b]
热设计功耗 注释/
外形尺寸
CUDA核心
(总数)
基础
频率
最大
增强
频率[c]
总线
类型
总线字长 容量大小 频率 带宽 半精度 Tensor Core FP32 累加 单精度
MADFMA
双精度
FMA
单位 MHz MHz MHz bit GB MT/s英语Transfers per second GB/s GFLOPs GFLOPs GFLOPs W
C870 GPU Computing Module[d] Tesla英语Tesla (microarchitecture) 2007年
5月2日
1× G80 600 128 1350 不适用 GDDR3 384 1.5 1600 76.8 345.6 1.0 170.9 Internal PCIe GPU (full-height, dual-slot)
D870 Deskside Computer[d] 2007年
5月2日
2× G80 600 256 1350 不适用 GDDR3 2× 384 2× 1.5 1600 2× 76.8 691.2 1.0 520 Deskside or 3U 19-inch rack英语19-inch rack external GPUs
S870 GPU Computing Server[d] 2007年
5月2日
4× G80 600 512 1350 不适用 GDDR3 4× 384 4× 1.5 1600 4× 76.8 1382.4 1.0 1U 19-inch rack英语19-inch rack external GPUs, connect via 2× PCIe (×16)
C1060 GPU Computing Module[e] 2009年
4月9日
1× GT200 602 240 1296[2] 不适用 GDDR3 512 4 1600 102.4 622.08 77.76 1.3 187.8 Internal PCIe GPU (full-height, dual-slot)
S1070 GPU Computing Server "400 configuration"[e] 2008年
6月1日
4× GT200 602 960 1296 不适用 GDDR3 4× 512 4× 4 1538.4 4× 98.5 2488.3 311.0 1.3 800 1U 19-inch rack英语19-inch rack external GPUs, connect via 2× PCIe (×8 or ×16)
S1070 GPU Computing Server "500 configuration"[e] 1440 不适用 2764.8 345.6
S1075 GPU Computing Server[e][3] 2008年
6月1日
4× GT200 602 960 1440 不适用 GDDR3 4× 512 4× 4 1538.4 4× 98.5 2764.8 345.6 1.3 1U 19-inch rack英语19-inch rack external GPUs, connect via 1× PCIe (×8 or ×16)
Quadro Plex 2200 D2 Visual Computing System[f] 2008年
7月25日
2× GT200GL 648 480 1296 不适用 GDDR3 2× 512 2× 4 1600 2× 102.4 1244.2 155.5 1.3 Deskside or 3U 19-inch rack英语19-inch rack external GPUs with 4 dual-link DVI outputs
Quadro Plex 2200 S4 Visual Computing System[f] 2008年
7月25日
4× GT200GL 648 960 1296 不适用 GDDR3 4× 512 4× 4 1600 4× 102.4 2488.3 311.0 1.3 1200 1U 19-inch rack英语19-inch rack external GPUs, connect via 2× PCIe (×8 or ×16)
C2050 GPU Computing Module[4] Fermi 2011年
7月25日
1× GF100 575 448 1150 不适用 GDDR5 384 3[g] 3000 144 1030.4 515.2 2.0 247 Internal PCIe GPU (full-height, dual-slot)
M2050 GPU Computing Module[5] 2011年
7月25日
不适用 3092 148.4 225
C2070 GPU Computing Module[4] July 25, 2011 1× GF100 575 448 1150 不适用 GDDR5 384 6[g] 3000 144 1030.4 515.2 2.0 247 Internal PCIe GPU (full-height, dual-slot)
C2075 GPU Computing Module[6] 2011年
7月25日
不适用 3000 144 225
M2070/M2070Q GPU Computing Module[7] 2011年
7月25日
不适用 3132 150.336 225
M2090 GPU Computing Module[8] 2011年
7月25日
1× GF110 650 512 1300 不适用 GDDR5 384 6[g] 3700 177.6 1331.2 665.6 2.0 225 Internal PCIe GPU (full-height, dual-slot)
S2050 GPU Computing Server 2011年
7月25日
4× GF100 575 1792 1150 不适用 GDDR5 4× 384 4× 3[g] 3 4× 148.4 4121.6 2060.8 2.0 900 1U 19-inch rack英语19-inch rack external GPUs, connect via 2× PCIe (×8 or ×16)
S2070 GPU Computing Server 不适用 4× 6[g]
K10 GPU accelerator[9] Kepler 2012年
5月1日
2× GK104 不适用 3072 745 ? GDDR5 2× 256 2× 4 5000 2× 160 4577 190.7 3.0 225 Internal PCIe GPU (full-height, dual-slot)
K20 GPU accelerator[10][11] 2012年
11月12日
1× GK110 不适用 2496 706 758 GDDR5 320 5 5200 208 3524 1175 3.5 225 Internal PCIe GPU (full-height, dual-slot)
K20X GPU accelerator[12] 2012年
11月12日
1× GK110 不适用 2688 732 ? GDDR5 384 6 5200 250 3935 1312 3.5 235 Internal PCIe GPU (full-height, dual-slot)
K40 GPU accelerator[13] 2013年
10月8日
1× GK110B 不适用 2880 745 875 GDDR5 384 12[g] 6000 288 4291–5040 1430–1680 3.5 235 Internal PCIe GPU (full-height, dual-slot)
K80 GPU accelerator[14] 2014年
11月17日
2× GK210 不适用 4992 560 875 GDDR5 2× 384 2× 12 5000 2× 240 5591–8736 1864–2912 3.7 300 Internal PCIe GPU (full-height, dual-slot)
M4 GPU accelerator[15][16] Maxwell英语Maxwell (microarchitecture) 2015年
11月10日
1× GM206 不适用 1024 872 1072 GDDR5 128 4 5500 88 1786–2195 55.81–68.61 5.2 50–75 Internal PCIe GPU (half-height, single-slot)
M6 GPU accelerator[17] 2015年
8月30日
1× GM204-995-A1 不适用 1536 722 1051 GDDR5 256 8 4600 147.2 2218–3229 69.3–100.9 5.2 75–100 Internal MXM GPU
M10 GPU accelerator[18] 4× GM107 不适用 2560 1033 ? GDDR5 4× 128 4× 8 5188 4× 83 5289 165.3 5.2 225 Internal PCIe GPU (full-height, dual-slot)
M40 GPU accelerator[16][19] 2015年
11月10日
1× GM200 不适用 3072 948 1114 GDDR5 384 12 6000 288 5825–6844 182.0–213.9 5.2 250 Internal PCIe GPU (full-height, dual-slot)
M60 GPU accelerator[20] 2015年
8月30日
2× GM204-895-A1 不适用 4096 899 1178 GDDR5 2× 256 2× 8 5000 2× 160 7365–9650 230.1–301.6 5.2 225–300 Internal PCIe GPU (full-height, dual-slot)
P4 GPU accelerator[21] Pascal 2016年
9月13日
1× GP104 不适用 2560 810 1063 GDDR5 256 8 6000 192.0 4147–5443 129.6–170.1 6.1 50-75 PCI Express card
P6 GPU accelerator[22][23] 2017年
3月24日
1× GP104-995-A1 不适用 2048 1012 1506 GDDR5 256 16 3003 192.2 6169 192.8 6.1 90 行动PCI Express模块 card
P40 GPU accelerator[21] 2016年
9月13日
1× GP102 不适用 3840 1303 1531 GDDR5 384 24 7200 345.6 10007–11758 312.7–367.4 6.1 250 PCI Express card
P100 GPU accelerator (mezzanine)[24][25] 2016年
4月5日
1× GP100-890-A1 不适用 3584 1328 1480 HBM2 4096 16 1430 732 9519–10609 4760–5304 6.0 300 NVLink card
P100 GPU accelerator (16 GB card)[26] 2016年
6月20日
1× GP100 不适用 1126 1303 8071‒9340 4036‒4670 250 PCI Express card
P100 GPU accelerator (12 GB card)[26] 2016年
6月20日
不适用 3072 12 549 8071‒9340 4036‒4670
V100 GPU accelerator (mezzanine)[27][28][29] Volta 2017年
5月10日
1× GV100-895-A1 不适用 5120 未知 1,455 HBM2 4,096 16 or 32 1,750 900 119,192 14,899 7,450 7.0 300 SXM card
V100 GPU accelerator (PCIe card)[27][28][29] 2017年
6月21日
1× GV100 不适用 未知 1,370 112,224 14,028 7,014 250 PCIe card
V100 GPU accelerator (PCIe FHHL card) 2018年
3月27日
1× GV100 不适用 937 1,290 16 1,620 829.44 105,680 13,210 6,605 250 PCIe FHHL card
T4 GPU accelerator (PCIe card)[30][31] Turing 2018年
9月12日
1× TU104-895-A1 不适用 2,560 585 1,590 GDDR6 256 16 5,000 320 64,800 8,100 未知 7.5 70 PCIe card
A2 GPU accelerator (PCIe card)[32] Ampere 2021年
11月10日
1× GA107 不适用 1,280 1,440 1,770 GDDR6 128 16 6,252 200 18,124 4,531 140 8.6 40-60 PCIe card (half height, single-slot)
A10 GPU accelerator (PCIe card)[33] 2021年
4月12日
1× GA102-890-A1 不适用 9,216 885 1,695 GDDR6 384 24 6,252 600 124,960 31,240 976 8.6 150 PCIe card (single-slot)
A16 GPU accelerator (PCIe card)[34] 2021年
4月12日
4× GA107 不适用 4× 1,280 885 1,695 GDDR6 4× 128 4× 16 7,242 4× 200 4x 18,432 4× 4,608 1,084.8 8.6 250 PCIe card (dual-slot)
A30 GPU accelerator (PCIe card)[35] 2021年
4月12日
1× GA100 不适用 3,584 930 1,440 HBM2 3,072 24 1,215 933.1 165,120 10,320 5,161 8.0 165 PCIe card (dual-slot)
A40 GPU accelerator (PCIe card)[36] 2020年
10月5日
1× GA102 不适用 10,752 1,305 1,740 GDDR6 384 48 7,248 695.8 149,680 37,420 1,168 8.6 300 PCIe card (dual-slot)
A100 GPU accelerator (PCIe card)[37][38] 2020年
5月14日[39]
1× GA100-883AA-A1 不适用 6,912 765 1410 HBM2 5,120 40 or 80 1,215 1,555 312,000 19,500 9,700 8.0 250 PCIe card (dual-slot)
H100 GPU accelerator (PCIe card)[40] Hopper 2022年
3月22日[41]
1× GH100[42] 不适用 14,592 1,065 1,755 CUDA 1620 TC HBM2e 5120 80 1,000 2,039 756,449 51,200 25,600 9.0 350 PCIe card (dual-slot)
H100 GPU accelerator (SXM card) 不适用 16,896 1,065 1,980 CUDA 1,830 TC HBM3 5,120 80 1,500 3,352 989,430 66,900 33,500 9.0 700 SXM card
L40 GPU accelerator[43] Ada Lovelace 2022年
10月13日
1× AD102[44] 不适用 18,176 735 2,490 GDDR6 384 48 2,250 864 362,066 90,516 1,414 8.9 300 PCIe card (dual-slot)
L4 GPU accelerator[45][46] 2023年
3月21日[47]
1x AD104[48] 不适用 7,424 795 2,040 GDDR6 192 24 1,563 300 121,000 30,300 490 8.9 72 HHHL single slot PCIe card
型号 微架构 发布时间 芯片 核心
频率
渲染器 内存 算力[a] CUDA
运算能力
热设计功耗 注释/
外形尺寸
CUDA核心
(总数)
基础
频率
最大
增强
频率[c]
总线
类型
总线字长 容量大小 频率 带宽 半精度 Tensor Core FP32 累加 单精度
MADFMA
双精度
FMA

注释:

  1. ^ 1.0 1.1 To calculate the processing power see Tesla (微架构)英语Tesla (微架构), 费米微架构, Kepler (微架构), Maxwell (microarchitecture)英语Maxwell (microarchitecture), or 帕斯卡 (微架构). A number range specifies the minimum and maximum processing power at, respectively, the base clock and maximum boost clock.
  2. ^ Core architecture version according to the CUDA programming guide.
  3. ^ 3.0 3.1 GPU Boost is a default feature that increases the core clock rate while remaining under the card's predetermined power budget. Multiple boost clocks are available, but this table lists the highest clock supported by each card.[1]
  4. ^ 4.0 4.1 4.2 Specifications not specified by Nvidia assumed to be based on the NVIDIA GeForce 8GTX
  5. ^ 5.0 5.1 5.2 5.3 Specifications not specified by Nvidia assumed to be based on the NVIDIA GeForce 200
  6. ^ 6.0 6.1 Specifications not specified by Nvidia assumed to be based on the Quadro FX 5800
  7. ^ 7.0 7.1 7.2 7.3 7.4 7.5 With ECC on, a portion of the dedicated memory is used for ECC bits, so the available user memory is reduced by 12.5%. (e.g. 4 GB total memory yields 3.5 GB of user available memory.)

另见

编辑

参考资料

编辑
  1. ^ Nvidia GPU Boost For Tesla (PDF). January 2014 [7 December 2015]. (原始内容存档 (PDF)于2020-05-16). 
  2. ^ Tesla C1060 Computing Processor Board (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24). 
  3. ^ Difference between Tesla S1070 and S1075. 31 October 2008 [January 29, 2017]. (原始内容存档于2012-02-26). S1075 has one interface card 
  4. ^ 4.0 4.1 Tesla C2050 and Tesla C2070 Computing Processor (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24). 
  5. ^ Tesla M2050 and Tesla M2070/M2070Q Dual-Slot Computing Processor Modules (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24). 
  6. ^ Tesla C2075 Computing Processor Board (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24). 
  7. ^ Hand, Randall. NVidia Tesla M2050 & M2070/M2070Q Specs OnlineVizWorld.com. VizWorld.com. 2010-08-23 [2015-12-11]. (原始内容存档于2020-08-17). 
  8. ^ Tesla M2090 Dual-Slot Computing Processor Module (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-10-26). 
  9. ^ Tesla K10 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24). 
  10. ^ Tesla K20 GPU active accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2017-07-12). 
  11. ^ Tesla K20 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-03-26). 
  12. ^ Tesla K20X GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-11-24). 
  13. ^ Tesla K40 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2020-06-17). 
  14. ^ Tesla K80 GPU accelerator (PDF). Images.nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2018-07-12). 
  15. ^ Nvidia Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning. Anandtech.com. [2015-12-11]. (原始内容存档于2020-11-08). 
  16. ^ 16.0 16.1 Accelerating Hyperscale Datacenter Applications with Tesla GPUs | Parallel Forall. Devblogs.nvidia.com. 2015-11-10 [2015-12-11]. (原始内容存档于2017-07-09). 
  17. ^ Tesla M6 (PDF). Images.nvidia.com. [2016-05-28]. (原始内容存档 (PDF)于2020-10-22). 
  18. ^ Tesla M10 (PDF). Images.nvidia.com. [2016-10-29]. (原始内容存档 (PDF)于2017-05-10). 
  19. ^ Tesla M40 (PDF). Images.nvidia.com. [2015-12-11]. (原始内容存档 (PDF)于2016-10-21). 
  20. ^ Tesla M60 (PDF). Images.nvidia.com. [2016-05-27]. (原始内容存档 (PDF)于2020-10-22). 
  21. ^ 21.0 21.1 Smith, Ryan. Nvidia Announces Tesla P40 & Tesla P4 - Network Inference, Big & Small. Anandtech. 13 September 2016 [13 September 2016]. (原始内容存档于2021-01-16). 
  22. ^ Tesla P6 (PDF). www.nvidia.com. [2019-03-07]. (原始内容存档 (PDF)于2020-07-28). 
  23. ^ Tesla P6 Specs. www.techpowerup.com. [2019-03-07]. (原始内容存档于2020-07-28). 
  24. ^ Smith, Ryan. Nvidia Announces Tesla P100 Accelerator - Pascal GP100 for HPC. Anandtech.com. Anandtech.com. 5 April 2016 [5 April 2016]. (原始内容存档于2016-07-30). 
  25. ^ Harris, Mark. Inside Pascal: Nvidia’s Newest Computing Platform. [13 September 2016]. (原始内容存档于2017-05-07). 
  26. ^ 26.0 26.1 Smith, Ryan. NVidia Announces PCI Express Tesla P100. Anandtech.com. 20 June 2016 [21 June 2016]. (原始内容存档于2020-11-11). 
  27. ^ 27.0 27.1 Smith, Ryan. The Nvidia GPU Technology Conference 2017 Keynote Live Blog. Anandtech. 10 May 2017 [10 May 2017]. 
  28. ^ 28.0 28.1 Smith, Ryan. NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced. Anandtech. 10 May 2017 [10 May 2017]. 
  29. ^ 29.0 29.1 Oh, Nate. NVIDIA Formally Announces V100: Available later this Year. Anandtech.com. 20 June 2017 [20 June 2017]. 
  30. ^ NVIDIA TESLA T4 TENSOR CORE GPU. NVIDIA. [17 October 2018]. 
  31. ^ NVIDIA Tesla T4 Tensor Core Product Brief (PDF). www.nvidia.com. [2019-07-10]. 
  32. ^ NVIDIA TESLA A2 TENSOR CORE GPU. 
  33. ^ NVIDIA TESLA A10 TENSOR CORE GPU. 
  34. ^ NVIDIA TESLA A16 TENSOR CORE GPU. 
  35. ^ NVIDIA TESLA A30 TENSOR CORE GPU. 
  36. ^ NVIDIA TESLA A40 TENSOR CORE GPU. 
  37. ^ NVIDIA TESLA A100 TENSOR CORE GPU. NVIDIA. [14 January 2021]. 
  38. ^ NVIDIA Tesla A100 Tensor Core Product Brief (PDF). www.nvidia.com. [2020-09-22]. 
  39. ^ Smith, Ryan. NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator. AnandTech. May 14, 2020. 
  40. ^ https://www.nvidia.com/en-us/data-center/h100/
  41. ^ https://wccftech.com/nvidia-hopper-gh100-gpu-official-5nm-process-worlds-fastest-hpc-chip-80-billion-transistors-hbm3-memory/
  42. ^ https://www.techpowerup.com/gpu-specs/h100-pcie.c3899
  43. ^ https://www.nvidia.com/en-us/data-center/l40/
  44. ^ https://www.techpowerup.com/gpu-specs/l40.c3959
  45. ^ https://www.nvidia.com/en-us/data-center/l4/
  46. ^ https://images.nvidia.com/aem-dam/Solutions/Data-Center/l4/nvidia-ada-gpu-architecture-whitepaper-v2.1.pdf
  47. ^ https://investor.nvidia.com/news/press-release-details/2023/NVIDIA-and-Google-Cloud-Deliver-Powerful-New-Generative-AI-Platform-Built-on-the-New-L4-GPU-and-Vertex-AI/default.aspx
  48. ^ https://www.techpowerup.com/gpu-specs/l4.c4091

外部链接

编辑