面对世界芯片荒,昆仑芯片( 二 )


据介绍,百度AI芯片“昆仑”基于三星14nm工艺,由几万个小核心构成,内存带宽高达512GB/s,算力高达260Tops,功耗100 瓦特 。综合来看,“昆仑”拥有高性能、高性价比、易用3大特点:(1)高效:针对语音、NLP、图像等专门优化;(2)低成本:同等性能下成本降低10倍;(3)易用:支持paddle等多个深度学习框架;编程灵活度高;灵活支持训练和预测 。
据介绍“昆仑”是中国在大规模AI运算实践中催生出的芯片,基于百度8年的CPU、GPU和FPGA的AI加速器的研发,20多次迭代而生,是中国第一款云端全功能AI芯片,也是目前为止业内设计算力最高的AI芯片 。可高效地同时满足训练和推断的需求,除了常用深度学习算法等云端需求,还能适配诸如自然语言处理,大规模语音识别,自动驾驶,大规模推荐等具体终端场景的计算需求 。
李彦宏表示,中国改革开放40年来,在我们的发展过程当中,对于高端芯片而言,其实一直依赖进口,这是我们这一代从业者心中永远的痛 。当进入人工智能时代,情况将会发生改变 。百度自主研发的高端芯片,将去满足全世界开发者的各种需求 。支撑数十万开发者为社会造福 。对于百度AI芯片“昆仑”的发布,中国著名计算机专家,首批中国工程院院士倪光南表示:中兴事件发生后,各界都十分关注发展我国芯片产业,许多互联网企业和传统电子企业纷纷表示,要大力投入资金和队伍发展芯片事业,这种积极性应当肯定 。
这次百度发布了AI芯片,说明他们说到做到,这无疑是对我国芯片事业做出了贡献 。或对部分通用型服务器芯片形成替代众所周知,目前在云端的服务器/数据中心,更多的还是依赖于传统的X86 CPU或者GPU来做AI运算 。现在部分厂商也有开始采用可重复编程和可重新配置的FPGA来进行AI运算 。虽然CPU、GPU等通用型芯片以及FPGA可以适应相对更多种的算法,但是定制型的AI芯片的计算能力和计算效率都直接根据特定的算法的需要进行定制的,所以其可以实现体积小、功耗低、高可靠性、保密性强、计算性能高、计算效率高等优势 。
【面对世界芯片荒,昆仑芯片】所以,在其所针对的特定的应用领域,定制型的AI芯片的能效表现要远超CPU、GPU等通用型芯片以及半定制的FPGA,同等量级下,成本也更低 。所以,百度称其AI芯片“昆仑”实现了“同等性能下成本降低10倍”,这也并不难理解 。目前人工智能技术仍处于快速发展当中,大量的新的算法不断涌现,原有的算法也在持续优化,而且这种变化以各自的方式在加速 。
而定制型AI芯片由于其在设计之时就是针对特定算法进行固化的,所以无法做到灵活的适应各种算法 。这也使得定制型的AI芯片目前为止并未开始在数据中心/服务器领域大规模应用 。不过,对于百度这样的互联网巨头来说,其很多领域的需求都是非常明确和相对固定的,在其庞大的数据驱动下,不少领域的软件、算法也已经趋于成熟和稳定,在这种情况下,百度进一步追求性能和能效的最佳化,选择采用定制型的AI芯片也是必然 。
比如,百度的搜索业务已经发展了十多年了,在这个领域相关的软件和算法都已经非常的成熟,百度完全可以采用定制型的AI芯片部署到其搜索服务器当中 。其他的一些比较成熟的地图业务也同样如此 。而且以百度对于服务器芯片的需求的量级,也完全能够支撑的起自己的AI芯片业务(芯片出货的量级越大,成本越低) 。而且,采用自己的定制型AI芯片,不仅可以降低芯片的采购成本,同时在AI计算上也更加的高效,安全性也可以更高,还可以降低用电成本(同等性能下,功耗更低),对于大型的数据中心来说,电费也是一项很大的成本 。

推荐阅读