ATI Radeon HD 4000

ATI Radeon HD 4000系列,其显示核心代号Radeon R700,由AMDATI)研发并推出。Radeon HD 4000系列的第一款产品是RV770显示核心,采用此晶片的显卡名为Radeon HD 4850,有800个流处理器。而核心频率更高的HD 4870及HD 4890紧随其后,更率先采用GDDR5作为顯存。最高端显卡采用R700核心,是一款双晶片显卡产品,名为HD 4870 X2。

Radeon HD 4000 系列
发布日期2008年6月
代号Wekiva
显卡
入门GPURV710(4300、4500)
中端GPURV730(4600)
RV740(4700)
高端GPURV770 (4850、4870)
R700(4850 X2、4870 X2)
RV790 (HD 4890)
API支持
Direct3DDirect3D 10.1、Shader Model 4.1
历史
前代产品ATI Radeon HD 3000
后继产品ATI Radeon HD 5000

背景

编辑

与之前的系列不同,首发的Radeon R700显卡只是中端产品。这与AMD调整策略有关。过往,AMD往往在高端市场落后于NVIDIA。此次,AMD在中端市场主动出击,原因是该市场占用家群一个较大的比例,利润亦会较高。而对手NVIDIA方面,虽然推出了性能比较强的GTX 200系列显卡,但性价比明显比R700不足。以往的显卡开发,是先研制旗舰级产品,再将此功能削减,成为中端和低端显卡。面对着显示核心的架构愈来愈复杂,研发的成本和时间亦愈来愈高。另外,高端产品的市场比较细,产品往往只是技术的演示。而ATI在过往与NVIDIA竞争的过程中,经常错过适当的发布时间,不只输掉高端市场,亦减慢了中低端显卡的发布。

在AMD收购ATI后,市场策略亦开始调整。今次,公司只会研发针对主流市场的显卡,高端显卡则由双核心显卡补上,例如Radeon HD 4870 X2。

架构

编辑

整体的架构与上一代相约,但作出了多方面的微调。与上一代显卡系列一样,支持DirectX 10.1及Shader Model 4.1。RV770核心有9.56亿个晶体管,采用55 nm制程制造。

SIMD(Single Instruction Multiple Data)

编辑

同样是SIMD架构,核心拥有多个SIMD核心。每一个SIMD核心有16个流处理器、独立的纹理单元和L1缓存。 由于取消了共享缓存,各核心可以透过Global DataShare Unit互相沟通。而每个流处理器有5个ALU,换言之一个SIMD核心有80个ALU。与上一代不同,本次所有的ALU单元都可以作整数码元运算,可大大提升GPGPU应用的性能。RV770显示核心有10个SIMD核心,合共拥有800个流处理器。

流处理器(Stream Processing Unit)

编辑

RV770显示核心拥有800个流处理器,是上一代RV670的2.5倍。流处理器的结构并没有任何改变,只是数量上有所上升。每个流处理器有5个ALU,所有的ALU单元都可以作整数码元运算。流处理器的架构依然是4D+1D的结构,相对NVIDIA的全1D结构,虽然效率没有那么高,但架构简单,可以轻易提升流处理器的数量。AMD方面,每一个流处理器内的5个ALU会共享一个指令发射端口;NVIDIA方面,一个ALU需要独立的端口,难以有效提升流处理器的数量。

纹理单元(Texture Unit)

编辑

每一个SIMD核心都拥有1组纹理单元,换言之RV770拥有10组纹理单元。每组纹理单元内有4个纹理寻址单元,16个32位浮点纹理采样单元和4个纹理过滤单元。

缓存(Cache)

编辑

上一代的显示核心,缓存(Cache)是被所有的SIMD核心共享的。在R700显示核心中,每一个SIMD核心都拥有独立的Cache。这样做可以降低延迟,提高效率。上一代SIMD可透过共享缓存互相沟通,由于采用了独立缓存,所以AMD为每一个核心加装了Global DataShare Unit,作SIMD互相沟通之用。

片内互联

编辑

AMD放弃了Ring Bus架构链接顯存,改用回传统的Crossbar架构。因为纵使Ring Bus架构的结构简单且可以优化,但延迟率高,亦要用更多的晶体管。最重要的是R600显示Ring Bus架构对性能的帮助不明显,

存储器

编辑

RV770的存储器带宽是256-bit,但使用GDDR5的话仍可以保持高速率。

光栅单元(Render Back-Ends)

编辑

AMD重新设计了光栅单元,用来改善AA性能。亦取消了针对透明及雾化效果的运算单元。而AA算法仍然会交由Shader处理,凭着流处理器的数量是上一代的2.5倍,AA的性能亦有所提升。

CrossFire Sideport

编辑
 
R700的GPU互联架构

这一代的双显示核心设计仍使用PCI Express桥接晶片。此次使用的是PLX出品,功耗为3.8瓦的PEX 8647晶片,这块晶片支持PCIe 2.0,允许两颗GPU运作在相同的PCIe插槽但拥有两倍于前代产品(Radeon HD 3870 X2)的带宽。但AMD在此代显示核心上还内建了一个新的“CrossFire X Sideport”,用来协调多个显示核心之间的通讯[1],提供额外5GB/s且全双工的GPU间资料发送带宽,增进图形性能。如此一来两个GPU间的总带宽达到了21.8GB/s。籍此AMD利用两颗显示核心,组成一张显卡,用作对抗NVIDIA的高端产品。所以增加CrossFire的性能和效率就变得重要。在这一点上,CrossFire X Sideport内联器从未被激活,在任何支持CrossFire的驱动程式上。

UVD2(Unified Video Decoder 2 )

编辑

相对第一代的UVD,UVD2可以解码更高码率和分辨率的影片。另外,与NVIDIA的新PureVideo一样,可以支持两段影片同时解码,方便提供画中画功能。新增Dynamic Contrast技术,用来提升影片的光暗对比。另外,显示核心依然集成了声卡,支持声道由5.1升级到7.1,支持AC3DTS,亦追加对LPCM的支持。

Radeon HD 4550/4350会支持UVD 2.2。[2] 提高对高清影帧式的兼容性,支持新一代的视频输出。

AVT(Accelerated Video Transcoding)

编辑

利用AVT技术,用户可以利用R700显示核心,编码1080p的高清影片,这相当于GPGPU的一种应用。

其他技术

编辑

AMD选择了开放标准,例如苹果电脑推广的OpenCL,以至DirectX,或者AMD自家的Brook +。AMD认为NVIDIA的CUDA是闭源标准,最终都会失败。

物理引擎

编辑

AMD宣布与Havok合作共同优化在AMD四核心处理器下的游戏物理运算的表现,并表示会共同研究将来让显卡支持Havok物理引擎。有第三开发者声称,PhysX物理引擎可以在R700核心上实现。而NVIDIA就尽全力帮助那一位程序员,让R700核心支持CUDA技术,借此让核心支持PhysX物理引擎。[3]

Radeon HD 4870将会利用GDDR5作为顯存,是业界首次采用GDDR5装备显卡。相对而言,NVIDIA就显得比较保守,只采用GDDR3存储器,但可以保证产品发布顺利,亦提供足够的带宽。对上一次,ATI亦率先采用GDDR4作为X1950 XTX显卡的存储器,但由于频率提升有限,并未能为新产品提供更大的带宽。而GDDR5的带宽更大,功耗更低,亦符合AMD对节能的要求。

但由于GDDR5始终是新技术,所以开始的时候不能大量上市,亦耽误了HD 4870显卡的发布。而AMD放弃了Ring Bus存储器架构,采用GDDR5存储器是迫不得已的做法。

PowerPlay

编辑

这是一个电源管理技术,RV670将它首次引入到桌面市场中。而在R700显示核心中,有关的技术亦得到升级。例如,显示核心可以自行关闭不在工作中的处理单元,亦可以调整核心的电压和频率。顯存方面,就只有频率可以调整。

产品

编辑

Radeon HD 4800

编辑

最先推出的是Radeon HD 4850显卡,于2008年6月25日推出,目标是中端市场,拥有800个流处理器,采用GDDR3顯存。比较高端的Radeon HD 4870 亦在其后推出,除核心频率有所提升,更采用GDDR5显示存储器。另外,由于RV770的核心频率还有提升的空间,预计有厂商会推出超频版本的RV770显卡,用来与GTX 280显卡竞争。

旗舰型号Radeon HD 4870 X2已于2008年8月12日推出,采用双显示核心设计,对手是NVIDIA的GeForce GTX 280,而实际性能比NVIDIA Geforce GTX 280显卡更强,后来NVIDIA推出GeForce GTX 295方能战胜之。显示核心亦集成了CrossFire Sideport组件,两个显示核心可以双向5GB/s的带宽互相链接。[4] 桥接晶片方面,采用了PEX8647,支持PCI-E 2.0。[5]

这个系列最低端的是Radeon HD 4830,它有640个流处理器,对手是GeForce 9800 GT。[6]

AMD于2009年4月2日(原为4月6日,之后推迟到9日,最后由于产品提早在3月底发售,所以正式的官方发布时间定为4月2日)[7] 推出使用RV790核心的Radeon HD 4890,规格与Radeon HD 4870相似,但运作频率更高。对手是NVIDIA的GeForce GTX 275。RV790核心并不是单纯的RV770核心超频版本,还额外增加了300万个晶体管[8]

AMD于中国内地市场推出Radeon HD 4860,使用RV790核心,只拥有640个流处理器,采用512MB GDDR5顯存,由于以高时脉运作,所以性能与Radeon HD 4870接近。

Radeon HD 4700

编辑
 
ATI Radeon HD 4770显卡

Radeon HD 4770于2009年4月推出,使用AMD首款40nm绘图核心RV740,拥有640个流处理器,128bit顯存接口,但采用GDDR5顯存,以免存储器频宽不足。核心时脉750MHz,存储器时脉3200MHz。性能较Radeon HD 4830优胜,部分测试成绩甚至与Radeon HD 4850相近。由于需求高加上台积电的40nm晶片前期生产良率欠佳,造成市面上长期缺货,相同级别需要由Radeon HD 4850降价接替。本产品可视为半年后推出的Radeon HD 5000系列的实验品。

Radeon HD 4600

编辑
  • Radeon HD 4670 - 核心频率为750MHZ,采用GDDR3顯存,频率为1800MHz(容量是512/1024 MB)。核心拥有320个流处理器,但顯存频宽仅有128bit,规格参数与HD3850 128-bit(HD3690)相似[9]
  • Radeon HD 4650 - 核心频率比4670慢,采用GDDR2顯存。

Radeon HD 4550

编辑
 
ATI Radeon HD 4550显卡
  • Radeon HD 4550 - 有80个流处理器,采用GDDR3顯存,带宽只有64-bit。

Radeon HD 4350

编辑
  • Radeon HD 4350 - 与HD 4550同样有80个流处理器,但只采用GDDR2顯存。对手是GeForce 9400 GT。

FireStream 9000

编辑

GPGPU产品方面,AMD会推出基于RV770核心的FireStream 9250。它支持双精度和64位浮点运算。

显示核心规格列表

编辑

桌面型

编辑

独立显示核心

编辑
型号 发布日期 开发代号 制程 (nm) 晶体管数量 (百万) 晶片面积 (mm2) 总线接口 顯存容量 (MiB) 时钟频率 核心布置 填充率 顯存类型 运算性能
GFLOPS
热设计功耗 (W) GFLOPS/W
单精度浮点
运算能效
API支持 (版本) 发售价格 (美元)
核心 (MHz) 存储器 (MHz) 像素 (GP/s) 材质 (GT/s) 存储器带宽 (GB/s) 总线类型 存储器位宽 (位元) 单精度浮点数 双精度浮点数 空载 满载 DirectX OpenGL OpenCL
Radeon HD 4350 2008年9月30日 RV710 55 242 73 PCIe 2.0 x16
PCIe 2.0 x1
AGP 8x
256
512
1024
575 500 80:8:4 2.3 4.6 6.4 DDR2 64 92 20 4.6 10.1 3.3 1.0 ?
Radeon HD 4550 2008年9月30日 RV710 55 242 73 PCIe 2.0 x16 256
512
1024
600
600
600
800
80:8:4 2.4 4.8 6.4
12.8
DDR2
GDDR3
64 96 25 3.84 10.1 3.3 1.0 ?
Radeon HD 4650 2008年9月10日 RV730 PRO 55 514 146 PCIe 2.0 x16
AGP 8x
256
512
1024
600
650
400-500
500
700
320:32:8 4.8
5.2
19.2
20.8
12.8-16.0
16.0
22.4
DDR2
GDDR3
GDDR4
64
128
384
416
48 8.0
8.7
10.1 3.3 1.0 ?
Radeon HD 4670 2008年9月10日 RV730 XT 55 514 146 PCIe 2.0 x16
AGP 8x
512
1024
750
750
400-500
900
1000
320:32:8 6.0 24.0 12.8-16.0
28.8
32.0
DDR2
GDDR3
GDDR4
128 480 59 8.14 10.1 3.3 1.0 ?
Radeon HD 4730 2009年6月8日 RV770 CE 55 956 256 PCIe 2.0 x16 512 700
750
900
900
640:32:8 5.6
6.0
22.4
24.0
28.8 GDDR3 128 896
960
179.2
192
110 8.15 10.1 3.3 1.0 ?
Radeon HD 4770 2009年4月28日 RV740 40 826 137 PCIe 2.0 x16 512 750 800 640:32:16 12 24 51.2 GDDR5 128 960 192 80 12 10.1 3.3 1.0 ?
Radeon HD 4830 2008年10月21日 RV770 LE 55 956 256 PCIe 2.0 x16 512
1024
575 900 640:32:16 9.2 18.4 57.6 GDDR3
GDDR4
256 736 147.2 95 7.75 10.1 3.3 1.0 ?
Radeon HD 4850 2008年6月25日 RV770 PRO 55 956 256 PCIe 2.0 x16 512
1024
2048
625 993 800:40:16 10 25 63.55 GDDR3
GDDR4
256 1000 200 110 9.09 10.1 3.3 1.0 ?
Radeon HD 4860 2009年9月9日 RV790 GT 55 959 282 PCIe 2.0 x16 512
1024
700 750 640:32:16 11.2 22.4 96 GDDR5 256 896 179.2 130 6.89 10.1 3.3 1.0 ?
Radeon HD 4870 2008年6月25日 RV770 XT 55 956 256 PCIe 2.0 x16 512
1024
2048
750 900 800:40:16 12 30 115.2 GDDR5 256 1200 240 150 8 10.1 3.3 1.0 ?
Radeon HD 4890 2009年4月2日 RV790 XT 55 959 282 PCIe 2.0 x16 1024
2048
850 975 800:40:16 13.6 34 124.8 GDDR5 256 1360 272 190 7.16 10.1 3.3 1.0 ?
Radeon HD 4850 X2 2008年11月7日 R700 55 956x2 256x2 PCIe 2.0 x16 512x2
1024x2
625 993 800:40:16 ×2 2× 10 2× 25 2× 63.55 GDDR3 256x2 2000 400 250 8 10.1 3.3 1.0 ?
Radeon HD 4870 X2 2008年8月12日 R700 55 956x2 256x2 PCIe 2.0 x16 1024x2 750 900 800:40:16 ×2 2× 12 2× 30 2× 115.2 GDDR5 256x2 2400 480 286 8.39 10.1 3.3 1.0 ?

1 统一渲染单元数量 : 纹理映射单元数量 : 渲染输出单元数量
2GDDR5顯存的资料发送速率是其时钟频率的4倍,而非其它DDR存储器的两倍
3热设计功耗(TDP)数值来源于超微官方资料。不同厂商的非公版显卡电路板设计会使得实际TDP数值和官方资料的有所不同。
4全部型号带有UVD2、ATI PowerPlay功能

集成式显示核心

编辑

这一列表是Radeon HD 4000中内建于AMD晶片组系列的型号,集成这些型号的晶片组有700系列800系列以及900系列(980G,实际是880G的更名版本)。这些型号全部支持DirectX 10.1以及OpenGL 3.3。

型号 发布日期 开发代号 图形核心 制程 (nm) 晶体管数量 (百万) 晶片面积 (mm2) 总线接口 存储器容量3 (MiB) 核心时脉2 (MHz) 核心布置1 填充率 顯存类型 运算性能
GFLOPS
特性/备注
像素 (GP/s) 材质 (GT/s) FP32 (GP/s) 存储器带宽 (GB/s) 总线类型 有效时脉 (MHz) 存储器位宽 (位元)
Radeon HD 4200 Graphics (785G晶片组) 2009年8月 RS880 RV620 55 >205 ~73 (~9 × 8.05) HT 3.0 最高可从系统存储器占用512 + 可选的专用128(即板载顯存) 500 40:4:4 2 2 1 20.8 (系统存储器) + 2.6 (专用) HT (系统) + DDR2-1066 DDR3-1333 (专用) 1333 (专用) 16 (专用) 40 UVD2
Radeon HD 4250 Graphics (880G晶片组、980G晶片组) 2010年3月(880G)、2011年9月(980G) RS880 560 2.24 2.24 1.12 HT (系统) + DDR3-1333 (专用) 44.8
Radeon HD 4290 Graphics (890GX晶片组) RS880D 最多占用系统存储器512 + 专用128 700 2.8 2.8 1.4 56

1 统一渲染单元数量 : 纹理映射单元数量 : 渲染输出单元数量
2ATI PowerPlay节电技术生效时,核心时脉在不同的使用场合时会有所不同。这个列表列出的时脉数值是官方默认的时脉值参数
3集成显示核心的专用存储器采用特别的sideport总线,用作顯存

行动型显示核心

编辑

这个列表除了独立显示核心以外,还包括集成于北桥晶片内的集成式显示核心。

型号[10] 发布日期 型号代号 开发代号 制程 (nm) 总线接口 存储器容量 (MiB) 时钟频率 (MHz) 存储器时脉 (MHz) 核心布置1 填充率 存储器 API兼容性 (版本) 运算能力
GFLOPs
备注
像素 (GP/s) 材质 (GT/s) 带宽 (GB/s) 总线类型 总线位宽 (位元) DirectX OpenGL
Mobility Radeon HD 4200 2009年9月10日 未知 RV620 55 内建PCIe x16 1.1 可最多从系统存储器中占用512 500 800
(系统存储器)
40:4:4 2 2 6.4/12.8 DDR2 DDR3 64/128 10.1 2.0 40 UVD2, PowerPlay 7.0
Mobility Radeon HD 4225 2010年5月1日 未知 RV620 55 内建PCIe x16 1.1 可最多从系统存储器中占用512 380 800
(系统存储器)
40:4:4 1.52 1.52 6.4/12.8 DDR2 DDR3 64/128 10.1 2.0 30.4 UVD2, PowerPlay 7.0
Mobility Radeon HD 4250 2010年5月1日 未知 RV620 55 内建PCIe x16 1.1 可最多从系统存储器中占用512 500 800
(系统存储器)
40:4:4 2 2 6.4/12.8 DDR2 DDR3 64/128 10.1 2.0 40 UVD2, PowerPlay 7.0
Mobility Radeon HD 4270 2010年5月1日 未知 RV620 55 内建PCIe x16 1.1 可最多从系统存储器中占用512 590 800
(系统存储器)
40:4:4 2.36 2.36 6.4/12.8 DDR2 DDR3 64/128 10.1 2.0 47.2 UVD2, PowerPlay 7.0
Mobility Radeon HD 4330 2009年1月9日 M92 RV710 55 PCIe x16 2.0 512 450 600 80:8:4 1.8 3.6 9.6 DDR2
DDR3
GDDR3
64 10.1 3.3 72 UVD2, PowerPlay 7.0
Mobility Radeon HD 4530 2009年1月9日 M92 RV710 55 PCIe x16 2.0 512 500 700 80:8:4 2 4 11.2 DDR2
DDR3
GDDR3
64 10.1 3.3 80 UVD2, PowerPlay 7.0
Mobility Radeon HD 4550 2010年1月1日 M92 RV710 55 PCIe x16 2.0 512 550 700 80:8:4 2.2 4.4 11.2 DDR2
DDR3
GDDR3
64 10.1 3.3 80 UVD2, PowerPlay 7.0
Mobility Radeon HD 4570 2009年1月9日 M92 RV710 55 PCIe x16 2.0 512 680 800 80:8:4 2.72 5.44 12.8 DDR2
DDR3
GDDR3
64 10.1 3.3 108.8 UVD2, PowerPlay 7.0
Mobility Radeon HD 4650[11] 2009年1月9日 M96 RV730 55 PCIe x16 2.0 512
1024
500
550
600
800
320:32:8 4
4.4
16
17.6
19.2
25.6
DDR2
DDR3
GDDR3
128 10.1 3.3 320
352
UVD2, PowerPlay 7.0
Mobility Radeon HD 4670[11] 2009年1月9日 M96-XT RV730 55 PCIe x16 2.0 512
1024
675 800 320:32:8 5.4 21.6 12.8
25.6
DDR2
DDR3
GDDR3
128 10.1 3.3 432 UVD2, PowerPlay 7.0
Mobility Radeon HD 4830[12] 2009年3月3日[13] M97 RV740 40 PCIe x16 2.0 512
1024
400/600
400/600
800/900
800/900
640:32:16 6.4/9.6
6.4/9.6
12.8/19.2
12.8/19.2
25.6/28.8
25.6/28.8
GDDR3
DDR3
128 10.1 3.3 512/768
512/768
UVD2, PowerPlay 7.0
Mobility Radeon HD 4850[14] 2009年1月9日 M98 RV770 55 PCIe x16 2.0 1024 500 850
700
800:40:16 8 20 54.4
89.6
GDDR3
GDDR52
256 10.1 3.3 800 UVD2, PowerPlay 7.0
Mobility Radeon HD 4860[12] 2009年3月3日[13] M97 RV740 40 PCIe x16 2.0 1024 650 1000 640:32:16 10.4 20.8 64.0 GDDR52 128 10.1 3.3 832 UVD2, PowerPlay 7.0
Mobility Radeon HD 4870 2009年1月9日 M98-XT RV770 55 PCIe x16 2.0 512
1024
550 888
700
800:40:16 8.8 22 56.832
89.6
GDDR3
GDDR52
256 10.1 3.3 880 UVD2, PowerPlay 7.0
Mobility Radeon HD 4870 X2 2009年1月9日 M98-XT RV770 55 PCIe x16 2.0 2048 550 700 2x [800:40:16] 2x 8.8 2x 22 2x 89.6 GDDR52 2x 256 10.1 3.3 2x 880 UVD2, PowerPlay 7.0
双GPU解决方案

1 统一渲染单元数量 : 纹理映射单元数量 : 渲染输出单元数量
2GDDR5顯存的资料发送速率是其时钟频率的4倍,而非其它DDR存储器的两倍

参考文献

编辑
  1. ^ AMD绝地反击:Radeon HD 4870/4850正式发布. [2008-07-14]. (原始内容存档于2008-07-03). 
  2. ^ Radeon HD 4550/4350最终规格、价格详解. [2008-09-02]. (原始内容存档于2008-12-02). 
  3. ^ A卡支持PhysX物理加速 NVIDIA鼎力协助. [2008-07-08]. (原始内容存档于2008-07-08). 
  4. ^ Radeon HD 4870 X2正式发布. [2008-08-13]. (原始内容存档于2008-08-19). 
  5. ^ HD4870X2全面评测. [2008-08-13]. (原始内容存档于2015-09-24). 
  6. ^ Radeon HD 4830官方游戏性能展示. [2008-09-26]. (原始内容存档于2016-03-04). 
  7. ^ Radeon HD 4890准备就绪 提前一周发布. [2009-03-26]. (原始内容存档于2009-03-28). 
  8. ^ RV790晶体管数比RV770多. [2009-05-04]. (原始内容存档于2009-04-10). 
  9. ^ AMD正式发布新一代主流显卡Radeon HD 4600. [2008-09-12]. (原始内容存档于2008-09-13). 
  10. ^ ATI Radeon Mobility Graphics Cards. [2013-10-02]. (原始内容存档于2010-03-01). 
  11. ^ 11.0 11.1 ATI Mobility Radeon HD 4600 Series Graphics – Overview. [2013-10-02]. (原始内容存档于2010-02-10). 
  12. ^ 12.0 12.1 ATI Mobility Radeon HD 4800 Series[永久失效链接]
  13. ^ 13.0 13.1 AMD Launches World’s First 40 nm Graphics Processors. [2013-10-02]. (原始内容存档于2010-02-19). 
  14. ^ ATI Device ID page页面存档备份,存于互联网档案馆). Retrieved April 1, 2008.

参见

编辑

外部链接

编辑