TOP500第二台E级超算出现,AMD要在HPC上逆袭英特尔?

电子发烧友网报道(文/周凯扬)在今年的ISC2024上,新一期的TOP500全球超算榜单发布。除了瑞典超级计算机Alps空降第六之外,此次TOP500的前十名在排名上并没有太大变化,但我们还是从新的成绩中找到了一些别的亮点。

AMD实现TOP500近三成覆盖率

首先是卫冕成功的Frontier,这个由HPE打造的大规模超算系统部署在美国橡树岭国家实验室,此次拿下了1.206 Exaflop/s的HPL算力成绩,在开发人员的优化下,相较上次提交的1.194 Exflop/s成绩还有所提升。Frontier集成了9472块AMD Epyc 7713 64核2GHz CPU和37888块AMD Instinct MI250X GPU。

500

Frontier超算 / 美国橡树岭国家实验室

凭借AMD顶级Epyc CPU和Instinct GPU的搭配,Frontier可以说是当下已公开系统中,兼顾HPC和AI的最强超算。不仅如此,其能效表现同样不俗,52.93Gflops/W的成绩居于GREEN500能效榜单的第13位。

如果我们观察余下的TOP500超算,就会看到搭载了MI300A系列GPU的超算系统开始逐渐显现,比如美国劳伦斯利弗莫尔国家实验室的三台新系统,分别拿下了46、47和48的排名。而这三台均为El Capitan超算的子系统,今年部署完成后预计HPL算力可突破2 Exaflop/s。

根据AMD的说法,在新发布的TOP500超算系统中,由AMD硬件驱动的超算系统增加了29%,达到了156台。在能效榜单GREEN500上,由AMD硬件驱动的超算系统也达到了157台。虽然这与英特尔60%以上的份额还有不小差距,但其增长速度要远超英特尔。

英特尔首台E级超算出炉,性能还没到顶

去年拿下第二的Aurora超算在今年的TOP500上再进一步,获得了1.012 Exaflop/s的HPL算力成绩,成为TOP500历史上第二台E级超算,也是基于英特尔硬件的首台E级超算。由于去年Aurora尚未完成全面部署,所以只是勉强超过第三名的Eagle超算,HPL算力为585.34 PFlop/s。

500

Aurora超算 / 美国阿贡国家实验室

如今的Aurora离硬件全面到位还差一点,所以此次提交成绩只用到了80%到90%左右的节点,要在下一次TOP500榜单公布才能完成全面部署。但即便如此,Aurora的成绩依然成功突破了E级大关。如果按照这一规模来估算,加上阿贡实验室开发人员的优化,Aurora未来也有可能完成逆袭,超过Frontier,不过届时第一名很有可能会是同样完成部署的El Capitan。

另外值得一提的是,无论是Aurora还是Frontier,在测试混合精度算力的HPL-MxP上,两者都获得了超过10 Exaflop/s的成绩。其中Aurora凭借89%的系统拿下了10.6Exaflop/s的成绩,位列第一。但这一测试并不能代表绝对的AI性能,尤其是用于新一代的AI负载,因此在这一届ISC2024上,行业也在呼吁推出新的AI测试榜单。

由于Aurora部署进度经历了一再推迟,其能效相比其他超算系统略有逊色,只有26.15GFlops/w,这也是为何其系统功耗从去年的24.687MW提升至今年的38.698MW。相较之下算力还要高于Aurora的Frontier系统功耗只有22.786MW。

从目前前十名的榜单来看,基于英特尔Xeon处理器的系统依旧占据了一半席位,这足以说明英特尔在HPC上的持续统治地位。这还是在其HPC产品发布推迟的前提下,未来随着工艺的推进和发布计划重回正轨,英特尔依然有机会找回被夺去的份额。

英伟达开始发力,Arm CPU+GPU性能与能效双管齐下

此次TOP500最令人意想不到的应该是英伟达的全面发力,此前英伟达出现在TOP500榜单上主要是因为其GPU,在TOP500榜单中,半数带有加速器的系统都用到了英伟达的GPU。而此次TOP500上,则一共有8台系统基于英伟达的Grace Hopper处理器。

500

Alps超算 / 瑞士超算中心

这次空降的第六名是来自瑞士超算中心的Alps超算系统,该系统集成了英伟达的GH200超级芯片,算力成绩达到了270 PFlop/s。该系统从2021年开始计划部署,用于气候、物理和生命科学研究等HPC应用的同时,提供强大的AI算力。

我们如果观察同期发布的GREEN500能效榜单就会发现,基于英伟达Grace Hopper打造的超算系统包揽了前三的位置。这三台系统分别是德国超算JEDI、英国超算Isambard-AI和波兰超算Helios GPU,能效分别为72.733Gflops/W、68.835Gflops/W和66.948Gflops/W。即便是TOP500排名第六的Alps,其能效比也有51.98Gflops/W,在GREEN500上排名第14.

结合TOP500上也有不少x86超算使用英伟达的GPU,侧面反映了Arm架构在HPC系统上的能效优势。结合未来对于超算能效更加严格的要求,英伟达的CPU+GPU超级芯片方案的吸引力会越来越大。

超算的市场格局迎来新一轮剧变

可以看出,超算行业已经不再是过去英特尔一家独大的场面了,无论是AMD、英伟达等都在迎头赶上,甚至是以更快的速度夺取市场份额。在x86系统上,AMD的CPU与GPU组合已经成为不少超算中心和商业公司的首选,而且由于供货较为稳定,其部署速度也要快于其他超算系统。

在Arm系统上,英伟达已经开始发力,依仗Grace Hopper提供的性能和能效双重优势,与HPC方案商合作贡献了多台TOP500系统。未来随着GB200投入市场,凭借Blackwell架构在FP64精度上比Hopper架构高出30%的性能表现,相信会有更多的超算系统选择英伟达的硬件方案。

至于IBM的Power架构,目前前十名中只有老牌榜首Summit采用IBM的Power9 CPU,除此之外就只剩采用自研Arm核心和处理器的富岳超算系统这一特例了。鉴于目前具备自研HPC处理器的厂商并不多,未来各种众核处理器的HPC系统数量预计还是维持在个位数,但其性能往往都不容小觑。

与此同时,中国超算系统今年出现了销声匿迹的局面,今年的TOP500超算榜单上,没有一个来自中国的新超算系统,位列TOP500的中国超算系统,也从104台减少至80台。但实际上国内也有三台值得关注的新超算,分别是620 Pflop/s的天河星逸,以及神威海洋之光和天河三号,后两者的预估性能分别为2.05 Exaflop/s和1.5 Exaflop/s。但很有可能出于地缘政治的原因,国内超算纷纷选择了停止提交HPL成绩。

来自美国的超算系统从171台减少至160台,从这几年的趋势来看,美国更加致力于打造顶级超算。反倒是来自欧洲的超算系统从143台提升至160台,正式超过亚洲成为第二名,仅次于北美地区,足见欧盟对于HPC系统的投入。

在系统制造商上,HPE和联想依然是最大的两家制造商,尤其是联想,占据了32.4%的份额。但在总系统算力上,HPE打造的系统占据了36.1%的份额。这也说明了得益于HPE提供的HPE Cray OS操作系统以及Singshot-11互联方案,其在高端系统上更受欢迎。

随着摩尔定律的放缓或者说终止,在速度的提升上,我们已经看到了减缓的迹象,曾经在2030年实现10 Exascale的目标已经不太可能实现了,如今的能效指标也不允许我们一味地扩大超算规模。

500

声明:本文由电子发烧友原创

站务

  • 观网评论4月爆款文章↓

    4月初,美国财长耶伦访华,一时间“中国产能过剩论”被炒作起来,观察者网专栏作者陈经从“三个美国女人”的独特角度,阐释了中国产能包括新能源产能对世界经济的贡献,还对美国政......

全部专栏