d37,《高效能人士的七个习惯》

ARM新发布的N57/N73 NPU、G57 GPU、D37 DPU有何特点?

d37,《高效能人士的七个习惯》

ARM 今日隆重宣布了四款新芯片,分别是 Ethos-N57 和 N73 神经处理器(NPU)、Mali-G57 Valhall 图形处理器(GPU)、以及 Mali-D37 深度学习处理器(DPU) 。去年年初的时候,该公司首次宣布了“Project Trillium”NPU 产品线,并在几个月后详细介绍了其架构 。
在今年的 TechCon 大会上,ARM 正式将其命名为 Ethos 系列 。(题图 via AnandTech)作为 Trillium 的主力产品,N77 的曝光度要高得多 。不过在微体系架构上,与去年公布的相比,全新的 Ethos-N77 规格已有所变更和加强,支持分配 1~4MB 的静态随机存储器(SRAM) 。
对此,ARM 的解释是,客户需要更多的内存带宽,去处理网状网络的 NPU。因为动态随机存储器(DRAM)的带宽,无法像核心数量一样快地扩展到高端市场 。该公司旗舰型号,可在 1GHz 时种下提供高达 4 TOPS 的运算能力、且每瓦特能效也是可观的 5 TOPS,ARM 宣称其能够在不同 IP 上使用相同的构造块 。
所有 NPU 共享相同的 MAC 计算引擎(MCE)和可编程层引擎(PLE) 。前者由去年公布的 128 个 MAC 单元组成,并与 PLE 配对 。MCE、PLE、加上 SRAM,则组成了计算引擎(CE) 。作为可缩放的模块,其在 N77、N57 和 N37 之间略有不同 。就 CE 数量而言,它就有 16 倍、8 倍和 4 倍的配置 。
中端和低端版本的发布速度,较其它新一些的 IP 技术要快得多 。因为 ARM 认为,在每平方毫米的硅片成本都很受限的设备中,进行机器学习(ML)的兴趣正变得越来越大 。特别是诸如智能机面部解锁、或 DTV 分辨率提升等功能,正在成为许多商家的宣传重点,目前新 NPU IP 已交付给许多授权客户 。然后要介绍的,是 ARM 首款基于 Valhall 的中端 GPU,它就是 Mali-G57。
【d37,《高效能人士的七个习惯》】在今年早些时候的 Mali-G77 发布活动期间,ARM 已经透露过,预计我们可在明年的 SoC 中见到它的身影 。与我们过去三年见到的基于 Bifrost 的 GPU 相比,新 GPU 架构有了更大的变化,因为 ARM 彻底重建了其 图形 ISA 和计算的微体系架构 。今天,ARM 透露该公司将为中端 GPU 新品(Mali-G57)引入 Valhall 新架构,但并未披露有关新 GPU 的更精细的微架构配置 。
预计 G57 的方案会与 G77 非常相似,但缩小到了 G72 vs G52 的样子 。与具有每核三个执行引擎(3EE)的 G52 相比,改进后的 G57 可保证将性能提升至 1.3 倍左右、同时能效提升 30%、硅密度也提高了 30%(因为性能更强了) 。最后是 Mali-D37 深度学习运算单元(DPU),作为 ARM 的中端新主打,它将助力市场的更快普及 。

    推荐阅读