AMD大胜!全球超算新霸主出炉!美国军方用于模拟核爆及导弹设计

AMD大胜!全球超算新霸主出炉!美国军方用于模拟核爆及导弹设计

文章图片

AMD与劳伦斯利弗莫尔实验室(LLNL)今日宣布 , 搭载AMD芯片的El Capitan超算以1.742百亿亿次浮点运算的性能 , 登顶半年度的Top500榜单 , 成为全球已知最快的超级计算机 , 超越了此前位居榜首的1.3百亿亿次浮点运算的Frontier 。 而原本位居第二、由英特尔驱动的Aurora系统因未提交新的基准测试成绩而跌至第三位 , 暗示其部分运行的系统仍在多方面面临故障问题 。
El Capitan的规模令人惊叹 , 该系统拥有11136个节点 , 配备了44544个AMD的MI300A加速处理器(APU)、5.4PB的主内存以及性能卓越的“Rabbit”近节点存储子系统 。 在基准测试中 , El Capitan实现了每秒1.742 exaflops 次运算(百亿亿次浮点运算)的性能 , 相当于如果按照每秒一次的运算 , 需要540亿年才能实现(540*365*24*3600) 。 这个成绩 , 比榜单上排名第二的系统快了45% 。
美国核安全管理局(NNSA)将利用该系统通过模拟爆炸来更新美国核武库 , 从而消除地下核爆的需要 , 并模拟核储备的老化影响、安全性和可靠性 。 该系统还将用于开发两种新的洲际弹道导弹设计 , 并服务于高性能计算(HPC)和人工智能(AI)工作负载 , 或两者的融合 。

El Capitan的理论峰值(Rpeak)性能达到2.746百亿亿次浮点运算 。 然而 , 这一数字是在所有系统组件均以峰值速度运行且性能线性扩展的完美条件下计算得出的 , 这在现实中是不可行的 。

【AMD大胜!全球超算新霸主出炉!美国军方用于模拟核爆及导弹设计】在高性能Linpack(HPL)基准测试中 , El Capitan的实际使用性能(Rmax)达到了1.742百亿亿次浮点运算 , 这是衡量顶级超级计算机性能的标杆 。 未来通过进一步的系统调优 , Rmax有望进一步提升 。 该机构表示 , 在El Capitan被转移到机密网络之前 , 还将进行一次全面的HPL基准测试 。
值得注意的是 , HPL中的超级计算机系统性能是以全精度FP64来衡量的 。 相比之下 , 以AI为中心的超级计算机则使用更小的数据类型 , 从而获得更高的“AI百亿亿次浮点运算”评级 , 但这些评级并不能直接与Top500榜单上的排名相比较 。
在满载运行时 , El Capitan的功耗超过35兆瓦 , 能效比为58.89 Gigaflops/watt , 在最高效超级计算机的Green500排名中位列第18位 。
El Capitan拥有惊人的11039616个计算核心(CPU+GPU) , 分布在44544个AMD MI300A处理器上 。 这些APU将CPU和GPU核心集成在同一个物理封装中 。 每个MI300A芯片包含13个小芯片 , 其中许多是3D堆叠的 , 从而创建了一个包含24个Zen 4 CPU核心、一个CDNA 3图形引擎以及总计128GB的八层HBM3内存的单个芯片封装 。
总体而言 , MI300A芯片拥有1460亿个晶体管 , 是AMD投入生产的最大芯片 。 九个计算芯片(混合了5nm CPU和GPU)被3D堆叠在四个6nm基础芯片之上 , 这些基础芯片作为活跃的中介层 , 处理内存和I/O流量等功能 。 您可以深入了解El Capitan的拓扑结构 。 该架构采用缓存一致性内存来减少CPU和GPU之间的数据移动 , 这通常比计算本身消耗更多的功率 , 从而降低延迟并提高性能和能效 。 它还极大地简化了旧代码的移植和新代码的创建 。
HPE采用其Shasta架构构建了El Capitan系统 , 该架构由高密度液冷EX4000机柜和EX225a加速器刀片组成 , 通过Slingshot-11网络互连连接在一起 。 这一平台还为美国能源部(DOE)的其他两台百亿亿次超级计算机提供了动力:此前世界上最快的超级计算机Frontier以及屡遭推迟、由英特尔芯片驱动的Aurora 。 这使得HPE在Top500榜单上占据了前三名 , 且这三台机器都是榜单上首批且仅有的百亿亿次级别系统 。
相比之下 , El Capitan比Top500榜单上排名第二的超级计算机Frontier快45% 。 现在 , 由AMD驱动的Frontier在Top500榜单上排名第二 , 为AMD再添一枚荣誉勋章——AMD的芯片驱动了世界上两台最快的超级计算机 。 有趣的是 , Frontier超级计算机也提交了新的基准测试结果 , 达到了1.353百亿亿次浮点运算 , 高于此前提交的1.194百亿亿次浮点运算 。 其理论峰值性能也从1.714百亿亿次浮点运算提升到了2.055百亿亿次浮点运算 。
虽然El Capitan现在是世界上已知最快的超级计算机 , 据推测中国应该也拥有多台百亿亿次级别的机器 。 但这些机器并未被提交至Top500榜单 。
令人惊讶的是 , 美国能源部并未为英特尔的Aurora提交新的基准测试结果 。 六个月前 , Aurora的提交使其在Top500榜单上稳居第二 , 但当时该系统并未完全运行 。 相反 , 基准测试仅包含了87%的系统活跃度 。 当时 , 英特尔表示Aurora存在诸多硬件问题 , 包括硬件和冷却系统故障、操作错误以及网络不稳定等 。 未提交新的测试结果意味着这些问题尚未得到完全解决 。 不过 , Aurora在以AI为中心的HPL-MxP混合精度基准测试中仍保持领先 , 成为世界上已知最快的AI超级计算机 , 性能达到10.6 AI百亿亿次浮点运算 。
事实上 , 在Top500榜单前十名中 , 有五台超级计算机由AMD驱动 , 三台由英特尔驱动 , 一台由英伟达驱动 , 而日本定制构建的Arm Fugaku也占据了一席之地 。 LLNL还评论称 , 就类似规模而言 , 该系统是部署成本效益最高的系统 , 这表明El Capitan不仅是世界上最快的超级计算机 , 而且在技术前沿也是最经济的 。
本文由EETOP编译整理自:tomshardware
https://www.tomshardware.com/pc-components/cpus/amd-powered-el-capitan-is-now-the-worlds-fastest-supercomputer-with-1-7-exaflops-of-performance-fastest-intel-machine-falls-to-third-place-on-top500-list

    推荐阅读