沙虫科技网logo.png沙虫科技网

沙虫科技网
提供IT业界的新鲜事、奇趣事和热门焦点,掌控最热最新的互联网新闻、科技新闻和IT业界动态。
沙虫科技网

ARM宣布采用新的ValhallGPU架构和1.4倍性能改进的Mali-G77 GPU

ARM在其年度TechDay上宣布了Mali-G77 GPU以及Cortex-A77 CPU。虽然Cortex-A77是其前代产品Cortex-A76的重大发展,但Mali-G77 GPU完全不同。这是自Mali-G71以来引入全新GPU架构的ARM Mali阵容中的第一款GPU,该架构于2016年推出了Bifrost架构.Mali-G77带来了全新的“Valhall”架构。

虽然ARM的CPU IP在更广泛的智能手机领域一直具有相当的竞争力,但该公司的Mali系列GPU多年来一直难以与最佳解决方案竞争。Mali系列GPU在性能和功效方面一次又一次地证明不如Adreno和Imagination Technologies的PowerVR GPU。Bifrost架构继承了Midgard架构,从矢量类型切换到标量类型。不幸的是,它并没有导致克服性能和功率效率差距似乎越来越大。Mali-G71和Mali-G72遭受了过高的功耗和节流,这使得它们不如高通的Adreno GPU和Apple的定制GPU(从Apple A11开始)。

糟糕的GPU性能成为如此重要的问题,供应商正在低估在一代人之后实现的小GPU增长的前景。例如,Exynos 9810的Mali-G72MP18 GPU与其前身相比略有改进。华为的海思集团在很大程度上与马里GPU竞争。HiSilicon Kirin 960和麒麟970被消耗异常高功率的GPU所打倒,同时提供相对较低的性能,华为被迫引入非常规限制机制,导致几款华为手机被发现基准作弊去年。

值得庆幸的是,去年的Mali-G76在性能和功率效率方面都做出了重大改进。使用10核版本的Mali-G76,HiSilicon能够保证46%的性能提升,即使公司达到了性能数字,它仍然无法获得GPU性能(无论是峰值还是持续性能)以及电源效率冠。三星系统LSI在Exynos 9820中实现了12核版本的GPU,最终缩小了与高通Snapdragon 855的Adreno 640 GPU 的差距。高通公司的Adreno GPU一直是Android市场的领导者,但苹果去年凭借Apple A12的定制GPU走得更好。Apple在峰值和持续性能方面均能够击败高通,并且该公司也展示了具有竞争力的电源效率。目前,A12的GPU仍然是领先者,而Snapdragon 855的Adreno 640 GPU在大多数基准测试中排名第二。

面对这种竞争环境,ARM需要加紧迎接挑战。

其结果是Mali-G77和新的Valhall建筑。ARM表示,它将性能密度提高30%,能效提高30%,机器学习(ML)提高60%。ARM预计基于Mali-G77的移动设备的峰值图形性能将提高40%。

该公司预计Mali-G77将为手机带来更多高端游戏,并指出2018年是手机游戏收入首次超过控制台和PC游戏收入的一年。

关于ML,ARM表示Mali-G77为设备提供了在设备上更快地执行“日益复杂”的ML任务的能力,性能密度提高了60%。这比将它们发送到云进行处理更好,这会导致更多的安全问题和性能下降,以及更高的延迟。

新的Valhall架构是Mali-G77和未来Mali GPU的基础。ARM表示,Valhall的以下功能使其成为“新颖的架构”:

“一种新的超标量发动机,在能效和性能密度方面实现了又一次飞跃

带有新指令集的简化标量ISA,更易于编译

新的动态调度指令

重写的数据结构更好地与现代API(如Vulkan)保持一致。

虽然有许多不同的进步和新功能,但两个关键的是Mali-G77中的执行引擎和纹理映射器。“

据ARM称,Mali-G77的广泛执行引擎通过共享对大量通道的控制来提高性能密度。Mali-G76每个着色器核心有8个经线和24个FMA通道,而Mali-G77有16个宽经线,32个通道(每个执行引擎有两个16 FMA集群)和每个着色器核心一个引擎。据该公司称,与G76相比,这导致同一区域的计算量增加了33%。

ARM还指出,Mali-G77改进的游戏性能与四纹理贴图相关联,后者提供四个纹素/周期,比Mali-G76的吞吐量提高2倍,比G72高4倍。据说它可以提供高保真和休闲游戏的全面改进,但它将对纹理沉重的游戏产生特别大的影响。据ARM称,G77的计算能力已经提高,因此还需要增加纹理能力以保持机器平衡。最终目标?每平方毫米提供比以前更多的性能。

Mali-G77经过优化,可与新的16宽执行引擎和四纹理映射器相匹配。此优化包括重新设计LSC和属性管道,重点关注性能密度和能效。

ARM表示,它“重点关注”提高能源效率,并宣传Mali-G77可以在两年前以相当于Mali-G72能量的50%的能量完成同样的工作。据该公司介绍,Valhall架构和Mali-G77提高了所有工作负载的能效,导致“广泛内容”的性能提高了1.3倍,这意味着用户将在高端设备上获得更长的电池寿命。

ARM表示,动态指令调度现在在硬件中处理,以实现更好的性能。据说动态调度程序决定从哪个warp执行哪些指令,然后以超标量样式向独立的并行ALU发出工作。

最后,ARM指出,Valhall架构继续通过AFBC 1.3进行ARM帧缓冲压缩。它带来了一些可以在ARM博客文章中阅读的新功能。

ARM对Mali-G77有一些重大承诺,宣称它将在复杂的AR和ML中带来显着的性能提升,并提供“不妥协的图形性能和更高的效率。”如果声称发布,我们终于可以看到ARM Mali GPU与特定一代的Adreno GPU正面交锋,甚至更好,移动GPU市场变得更具竞争力。

相关推荐