在游戏表现上,首批上市的锐炫 A370M 显卡主要面向中高画质游戏,主打场景在 1080P 帧下的大型游戏 。相比于 96EU 的 Xe 核显在帧率上有着 60 帧以上的表现 。
而在《堡垒之夜》、《GTA V》等需要高帧率的游戏场景下,锐炫 A370M 中高画质下帧率超过 90 帧,已经达到一个流畅的水平 。
创意生产场景下,和 12 代酷睿的集成显卡相比,在搭载 A370M 独立显卡的平台上,性能也有了显著提升 。在视频编解码方面,以 Davinci Resolve 为例,4K H.264 转 H.265 的性能可提升多达 60% 。而在 AI 相关功能上,例如 Adobe Promiere Pro 里的两个应用场景,更是有翻倍的性能提升 。
在创作场景下的提升,不光取决于显卡本身,同时还得益于英特尔全新的 Deep Link 技术带来的巨大提升 。下面我们来看看 Deep Link 的工作原理 。
英特尔 Deep Link 技术
英特尔 Deep Link 技术区别于以往单纯动态功率共享,英特尔锐炫显卡在与英特尔 12 代酷睿处理器之间除了功耗的动态共享,还引入了超级编码和超级算力能力 。
动态功率共享技术能在系统功耗的限制范围内,尽可能最大化释放 CPU 或 GPU 的性能 。英特尔已经在这项技术上探索了很长时间 。早在 2016 年,Kobe-Lake G 时代,我们就有第一版动态功率共享,在 CPU 裸片和 GPU 裸片之间动态分配功率 。
现在的 ADL 和 A 系列独立显卡之间这项功能也得到进一步应用,在运行负载时,如果 CPU 更需要功率,功率会更多的分配给 CPU,反之对 GPU 也是一样,最终目的是让这个负载有更好的性能 。
第二项技术则超级编码技术,这项技术的初衷是为最终用户提升编解码效率 。以前的编解码流程里,通常把编码工作放在一个显卡的编解码器上,编码效率成为了整个流程的性能瓶颈;而实际上现在的英特尔笔记本系统,例如搭载了 12 代酷睿处理器和锐炫 A 系列独立显卡的系统,集成显卡和独立显卡都有硬件编码能力 。所以超级编码技术,就是同时运用两个显卡的编解码引擎,来大大提升编解码效率 。
这种协作是通过 OneVPL 的 API 接口来实现的 。OneVPL 是一个跨平台的开放性框架,应用程序通过接口可以识别并调用平台上多个多媒体引擎,充分利用视频处理能力 。当超级编码开始工作时,一组组解码后的原始帧通过特定的 API 函数被交给 oneVPL,进而按组被分配到不同的多媒体引擎上,拷贝到相应的内存中缓存起来 。不论每一组有多少帧,相应的集显或者独显的多媒体引擎会开始按照设定的格式编码 。而 OneVPL 会完成后续的打包工作,把编码后的帧一组组拼接成最终视频来输出 。这种并行处理,编码效率比单一显卡提升非常显著 。
在算力提升上也有着与超级编码类似的逻辑,即尽可能地让整个系统都参与进来,并且合适的模块做合适的事,超级算力这项技术也是这样的逻辑 。
搭载英特尔锐炫独立显卡的笔记本可以从独立显卡的算力中获益,但英特尔 CPU 的集成显卡中同样也提供了计算引擎 。通过把负载合理的分配给不同的计算引擎,以此实现算力最大化 。这其中就使用了 OpenVino 中的 MLS 框架来将算力进行最大化的实现 。
MLS 能智能的把负载分配给不同的算力模块,通过延迟敏感度、吞吐量、性能要求、功率消耗等应用或负载的特征帮助 MLS 做出决策,把负载分配给独立显卡、集成显卡或者 CPU 。
通过 Deep Link 几项关键的技术,在创作场景英特尔酷睿笔记本 + 英特尔锐炫显卡的组合带来了性能的大幅提升 。系统各个模块更加紧密的协作,让每一个模块的性能得到充分释放 。基于这一理念,Deep Link 将英特尔平台上各个模块有机结合,让整体效率更进一步 。