当前位置: 主页 > 资讯 > AMD基于7nm的RDNA显卡架构解析:历时四年研发 修成正果

虽然GCN架构已经在AMD的显卡产品中,已经经受住了市场的历练与考验,加之长时间的不断优化积累,从某种程度上来说已经相当成功。但毕竟时代在发展,旧架构迟早也是要被淘汰在历史的长河中的,所以既然GCN逐渐开始无法满足我们的需求,那么AMD也是时候推出全新的架构了。

null

在凝结了研发团队4年的心血后,AMD也正是开启了第五代架构的革新之路,也就是最近发布的Radeon RX 5700系列所采用的Radeon DNA架构,即RDNA架构。从结果看来,RDNA架构的性能、功耗、能效比等多方面,均要全面领先于老式的GCN架构。RDNA也并非是GCN的修改版或是升级版,而是AMD彻头彻尾经过全方位重新设计的全新架构,完全兼容GCN架构的指令。

null

RDNA架构也是构成Radeon RX 5700系列显卡“Navi 10”GPU核心的重要组成之一,而其其它要素则分别是7nm工艺、GDDR6显存、PCI-e 4.0总线。

null

null

“Navi 10”GPU核心集成103亿晶体管,虽然比于自家Vega 64的125亿晶体管少了18%,但核心面积却比484mm²的Vega 64小了接近一半,大小仅251mm²,单位面积性能提升超过130%。而“Navi 10”GPU核心的性能相比于Vega 64提升14%,功耗降低23%,能效比提升超过50%。

null

null

RDNA架构在设计上的三大重点,分别是全新的CU计算单元设计、多级缓存一致性的结构、精简化的图形管道优化。

null

null

全新的CU计算单元一共分为40组,共计2560个流处理器、80个标量单元,以及160个64位双线性过滤单元。同时,RDNA架构中SIMD单元的组合方式不同,GCN拥有4组SIMD16单元、1个共享标量单元、1个共享向量单元。而RDNA则拥有2个SIMD32单元、2个共享标量单元、2个共享向量单元,整体的执行效率更高。

null

以Wave64指令为例,GCN架构仅支持Wave16长度的指令,因为仅有1个共享标量单元,所以Wave64指令会被分给4组SIMD单元中去,但每个时钟周期只能运行1组,所以需要4个周期才能完成一个Wave64指令。

null

null

null

null

null

null

但拥有2个SIMD32单元和2个共享标量单元的RDNA架构,却可以在一个时钟周期内同时由2个SIMD单元运行完成,整体效率提升4倍。

null

null

null

null

也正是如此,RDNA架构可以同时运行两个不同的Wave32指令或是一个Wave64指令,即Wave32/Wave64模式。除此之外,RDNA架构还能将2个CU计算单元组合成为一个工作组处理器,比如达到2倍与GCN架构的ALU单元与4倍于GCN架构的缓存带宽。

null

null

null

null

缓存方面,RDNA架构设计的多级一致性结构,让每对由CU计算单元所组成的工作组处理器都拥有属于自己的零级缓存,在增加4组新的一级缓存同时,降低了二级缓存的拥堵,大幅降低了整体的延迟与功耗。

null

null

图形管道方面也进行了精简的优化,包括4个增强的ACE异步计算引擎、地位更加中心化的结合处理器、64个像素单元。

null

RDNA架构在设计过程中,也借鉴过“Zen”架构设计的先进理念,比如在时钟门控方面,效率与能效极高,并且进一步减少了到达更高频率时需要的逻辑层级。

null

null

最后,Radeon的媒体引擎大幅改善了视频编码,增加了H.265 HDR/WCG编码器。全面支持H.264格式的4K+90FPS、1080P+360FPS编码和4K+150FPS、1080P+600FPS解码,H.265格式的4K+60FPS、1080P+360FPS编码和8K+24FPS、4K+90FPS、1080P+360FPS解码,VP9格式的8K+24FPS、4K+90FPS解码,同时整体编码速度提升40%。

精彩资讯报道,专业视频评测,尽在聚牛科技

  • 赞一下
  • 收藏

推荐阅读

  • 战神中的精盾 i9处理器首现神舟精盾笔记本

关注我们