1、GeForce GTX Titan 显示卡与 Radeon HD 7990 显示卡对比测试一直以来,英伟达和 AMD 旗舰级显示卡的龙争虎斗都会成为消费者讨论的焦点,本期 CHIP 就为大家带来两家最新的旗舰级显示卡产品的对比测试,为追求极致的发烧级玩家们提供参考。 去年,英伟达采用 GK104 核心的 GeForce GTX 680 和单卡双芯产品GeForce GTX 690 凸显了其小核心战略的成功,原以为英伟达 GeForce GTX 690 顺利拿下单卡卡皇的宝座之后,下一代旗舰产品应该是 GPU 架构更新换代的小核心产品。但是考虑到这一代产品在性能尚不能完全甩开对手,因此英伟达在公
2、司成立 20 周年之际,高调推出了由超级计算机领域直接“搬运”到桌面领域的 GeForce GTX Titan 这一超大核心的产品。这款产品一经推出便颠覆了高端显示卡市场 Radeon HD 7970 与 GeForce GTX 680 相对平衡的现状,一跃成为了目前性能最强的单芯旗舰产品,再加上之前就已存在的 GeForce GTX 690,一时之间,骨灰级玩家在谈及旗舰级显示卡时厂商似乎只有 N 卡可选择。面对如此的状况,AMD 自然不会坐以待毙,在 Radeon HD 7970 发布了一年多之后,AMD 终于在 4 月下旬正式推出了官方版的单卡双芯产品 Radeon HD 7990,它的
3、诞生意味着AMD 将停止目前在顶级显示卡市场碌碌无为的现状,重新披挂上阵征战旗舰级显示卡市场。 硬件规格:再创新高 英伟达 GeForce GTX Titan 采用的 GK110 核心架构与目前的 GeForce GTX 680 所采用的 GK104 核心很相似,如 SMX 单元包含 192 个 CUDA 核心和 16 个纹理单元,但是执行 DP 双精度的运算单元增加到了 64 个(GK104 只有 8 个) 。GK104 具有 35 亿个晶体管、8 组 SMX 单元、4 组 ROP管线及 4 组 GDDR5 控制器,而 GK110 完整版具有惊人的 15 组 SMX 单元、6 组 ROP 管
4、线以及 6 组 GDDR5 显存控制器,于是晶体管数量达到了 71 亿个,规模相比 GK104 几乎翻了一番。GeForce GTX Titan 只使用了 GK110核心 15 组 SMX 中的 14 组,不过保留了完整的 6 组 GDDR5 显存控制器和ROPs 管线,于是它总计有 2 688 个 CUDA 核心、896 个 DP CUDA 核心、224 个纹理单元、384bit 显存位宽、6GB 显存容量和 48 组 ROPs 单元。频率方面,由于 GeForce GTX Titan 有如此巨大的核心规模,所以它的核心频率显然不可能像 GeForce GTX 680 那样轻松突破 1GHz
5、,其基础频率只有 837MHz,Turbo 频率为 876MHz,比 GeForce GTX 680 的 1 006MHz/1 058MHz(Turbo 频率)低了不少,不过显存频率依然保留了 GeForce GTX 680 的水准为 6 008MHz,显存带宽高达 288.33GB/s。 AMD 的 Radeon HD 7990 采用的两颗核心与 Radeon HD 7970 所采用的Tahiti XT 相同,单颗 Tahiti XT 核心具有 2048 个流处理单元、128 个纹理单元及 32 个光栅单元,晶体管数量达到了 43.1 亿个,并配备了3GB/384bit 规格的 GDDR5
6、显存。于是 Radeon HD 7990 具有 4 096 个流处理器、256 个纹理单元和 64 个光栅单元,晶体管数量也达到了 86.2 亿个。物理显存容量虽然翻倍,但是由于双卡同时渲染工作的原因,实际使用时等效显存容量不变,依然为 3GB。频率方面,Radeon HD7990 的默认核心/显存频率为 1000MHz/6000MHz,显存带宽为 288GB/s,与对手基本持平。 架构设计:各有特色 英伟达的 GeForce GTX Titan 之所以被命名为 Titan,多半是因为英伟达对于目前世界上最快的超级计算机“Titan”的纪念。超级计算机“Titan”所采用的是目前世界上最快的专
7、业级显示卡 Tesla K20X,两者采用的都是同为 2 688 个 CUDA 核心的 NVIDIA Kepler GK110 核心,不同的只是两者的细节之处与面向的领域。 GeForce GTX Titan 采用的 GK110 核心仍旧基于 Kepler 架构,从某种意义上来说,它并不能算是一款“革新”的产品。不过,虽然 GK110核心与 GTX680 所采用的 GK104 核心同属 Kepler 架构范畴,但其相对后者 GK110 依然拥有不少的改变。从 GK110 核心 SMX 逻辑结构图中我们可以得知,虽然它与 GK104 的 SMX 具有相同的结构、相同的 192 个 CUDA Co
8、re 和相同的 16 个纹理单元,但是在 CUDA Core 的旁边,我们可以看到新加入了许多 DP Unit 单元,即 Double Precision Float Unit,意为双精度浮点单元。一组 SMX 中就包含 64 个 DP Unit,14 组共包含 896 个。英伟达在 GK110 核心中加入如此之多的双精度浮点单元,目的就是为大幅增强 GK110 的双精度浮点运算能力以满足和对手竞争的需求。 虽然 AMD 的 Radeon HD 7990 使用的依然是 AMD 在一年多以前发布的Tahiti 核心,但是现在看来它所使用的 GCN 架构依然非常先进。在 GCN阵列微观结构中,每个
9、 GCN 阵列里有 4 组 SIMD 单元,每组 SIMD 单元里面包括 16 个流处理器,我们可以发现 GCN 架构已经完全抛弃了此前4D+1D 流处理器 VLIW 的超长指令架构限制,不存在原有架构指令打包-派发-解包的问题,所有流处理器以 16 个为一组的 SIMD 阵列完成指令调度。虽然每次只能执行 1 个 ALU 操作,但是 4 组 SIMD 能保证执行 4 条线程,利用率接近 100%。整个架构从最基层开始就为更灵活地运算优化,架构中层的运算单元在并行效率上也有针对性地改进,整个 GCN 架构更加面向“通用计算就是图形计算”的未来趋势。 技术比拼 英伟达在 GeForce GTX
10、680 发布时引入了一种新的 GPU 动态超频技术GPU Boost,与 CPU 处理器中的 Turbo Boost 动态加速类似,都是在处理器允许的范围内动态调节核心频率。在 GeForce GTX Titan 显示卡中,GPU Boost 加速技术也升级到了第二代。 GPU Boost 2.0 放宽了电压的限制,在 GPU 温度控制上考虑了更多,因为相比高电压带来的危害,日常应用中 GPU 长时间处于高温状态更可能会损坏芯片。本次测试中GeForce GTX Titan 公版显示卡的 Boost 频率能达到 995MHz,相比默认的 837MHz 提升了 18.6%,比上一代公版 GeFo
11、rce GTX 680 常见的 10%要高一些,可以带来更多的性能提升。 除此之外,GeForce GTX Titan 还具有英伟达独有的 TXAA 技术,这是一大杀手锏。该技术类似在动画、电影、游戏 CG 中所采用的复杂高画质过滤器,可以减少因为锯齿导致画面出现撕裂和闪动等问题,画质比 MSAA、FXAA 以及 CSAA 更高,而且消耗资源较少。 AMD 方面,在画面渲染也有独到的优势。一直以来,人类头发在游戏中的实时精确渲染是游戏里最为复杂、最具挑战性的项目,成千上万、各自独立的微小细丝都是半透明的,而且都有复杂的阴影,这对 GPU 来说是非常巨大的负担。而 Radeon HD 7990
12、采用的 TressFX Hair 渲染技术,使用了 DirectCompute 编程语言,结合 AMD GCN 架构的强大并行计算能力,将头发渲染的工作部分转到了后期处理中。这不仅大大提高了运算效率,还让重力、风雨、头部运动等因素都被列入考虑的范围智能,因此能以更真实的方式描绘头发,让头发更加自然和逼真。 除此之外,Radeon HD 7990 集成了两个 Tahiti XT 核心,通过重新设计的 4 个 Mini Display Port+1 个 DVI 的输出接口,它原生即可支持5 连屏的 EYEFINITY 应用。此外,Radeon HD 7990 也继承了 Radeon HD 7970
13、 的智能核心休眠技术 ZeroCorePower,显示卡在空闲时可让一颗核心处于休眠状态,最大限度地降低显示卡功耗、发热和噪音。 性能、功耗互有胜负 无论两款产品的设计和采用的技术如何,对于游戏玩家来说显示卡的性能表现才是最重要的。在分别测试显示卡理论 DirectX 11 图形性能和曲面细分性能的 3DMark 11 和 Unigine Heaven Benchmark 4.0 测试中,Radeon HD 7990 均取得了不错的成绩,以较明显的优势取得领先。在随后的多款不同分辨率设置的热门游戏测试中,Radeon HD 7990 单卡双芯的劣势逐渐显露出来,在刺客的信条 3 、 上古卷轴
14、5中的成绩明显反常,想要在性能方面完胜对手,AMD 在驱动方面还需要下不少功夫。不过整体看来,在游戏性能这一环节,Radeon HD 7990 还是略胜一筹。 在显示卡高负载功耗测试中,由于如今的高端显示卡均具备了功耗保护功能,在使用 Furmark 等严酷的烤机软件进行测试时,显示卡会自动降低频率来保护自己不会损坏。这导致我们无法通过常用烤机软件来得到其准确的最大功耗,所以我们选择了用 3DMark 11 测试程序来测试整个平台的整体功耗(不含显示器) 。在待机功耗方面,GeForce GTX Titan 所在的平台整体待机功耗仅为 68W,Radeon HD 7990 的平台整机功耗略高,
15、为 91W。高负载状态下 GeForce GTX Titan 平台的最高功耗为380W,相比之下双芯的 Radeon HD 7990 平台最高功耗为 460W。因此在功耗表现方面,GeForce GTX Titan 完胜。 总结: 通过此次旗舰级产品的碰撞,AMD 又一次通过“1+12”的方式取得了胜利,重新夺回了单卡旗舰的宝座。虽然两者在零售价格方面都是 7 999 元,不过采用单芯设计的 GeForce GTX Titan 在成本方面有着明显的优势,AMD 为了夺回这个宝座可谓杀敌一千自损八百。 作为两家显示卡厂商在旗舰级产品上的扛鼎之作,在性能方面,两款产品可谓诚意十足,几乎所有的游戏在 25601440 分辨率的高画质设置下都可以流畅运行。虽然两者在性能方面有些差距,但是并不十分明显,不过 AMD 向来在后续驱动优化方面表现非常不错,因此 Radeon HD 7990 在性能方面还有不少优化的余地。从目前的信息看来,英伟达的下一代旗舰 GeForce GTX 780 的性能并不如目前的 GeForce GTX Titan,AMD 自家的 Radeon HD 8000 系列显示卡上市也仍需时日,因此Radeon HD 7990 自然是当今追求极致性能玩家的不二之选。