国产万卡集群初次真机亮相! 每节点640卡、总算力50亿亿次
联系我们
发布日期:2025-12-25 15:39 点击次数:62
对高算力无穷渴求的AI期间,最关节的照旧不是单卡性能,而是尽可能高效地堆叠填塞多的加快卡,组成高大的集群。
除了NVIDIA、AMD,国产厂商也正在这方面全力繁芜,华为、摩尔线程、中科晨曦等皆是杰出代表。
近日,中科晨曦厚爱发并展示了scaleX万卡超等群,这亦然国产万卡基AI集群的初次真机亮相。

不同于华为紧闭式的全自研集群,中科晨曦scaleX万卡超集群旨在构建怒放、兼容、高密度的超大限制算力基础智商。
它守旧多品牌加快卡、主流探究生态,照旧适配优化400多个主流大模子、天下模子等,可用于大模子考验、金融风控、地质动力勘察、科学智能等各式场景。
中科晨曦scaleX万卡超集群由多个scaleX640超节点(单机柜640卡)、scaleFabirc高速蚁集互连而成,认为领有10240块加快卡,总算力异常5EFlops(500亿亿次每秒)。
HBM内存总容量异常650TB,总带宽异常18PB/s;片间互连总带宽异常4.5PB/s,柜间互连总带宽异常500TB/s。
单个超节点的基本组成是千卡级探究单位,接收“一拖二”高密架构瞎想,完竣单机柜640卡超高速一致性互连,双探究柜则组成1280卡探究单位。

散热方面,接收超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等多本领交融改革瞎想,成为业界超高集成度的液冷超节点。
全浸没式相变液冷本领,将工作器澈底浸在特制液体中,中间液体冷凝换热安装CDM的散热才调高达1.72MW(兆瓦)。
单机柜算力密度比较业界其他超节点最大擢升20倍,PUE值低至1.04。
公开信息涌现,中科晨曦子公司晨曦数创领有139项液冷有关专利,是国内惟一完竣大限制交易化液冷部署的企业。

蚁集方面,中科晨曦自研的scaleFabric蚁集芯片可提供400Gb/s的超高带宽、低于1微秒的端侧通讯蔓延、260ns的交换芯片转发延时,超节点间的通讯性能达到业内先进水平,比较传统的InfiniBand蚁集擢升2.33倍。
基于面向大限制组网优化的蚁集左券、超高交换容量的蚁集芯片、极致的链路可靠性优化,集群限制得以膨大到10万卡以上,同期蚁集总体资本裁减30%。

优化方面,超等地谈瞎想完竣了芯片级、系统级、应用级的三级协同优化,通过BurstBuffer、XDS等本领,大模子训推成果擢升30-40%,GPU垄断率擢升最多55%,同期还有AI应用亲和、AI数据加快。

可靠性方面,一体化、智能化的集群管控,可大大提高MTBF(平均故障隔绝时期)、裁减MTTR(平均故障设随即间),集群永恒可用性达到99.99%,平均每30天的弗成用时期小于4分钟。

