国产万卡集群初次真机亮相! 每节点640卡、总算力50亿亿次

发布日期：2025-12-25 15:39 点击次数：62

对高算力无穷渴求的AI期间，最关节的照旧不是单卡性能，而是尽可能高效地堆叠填塞多的加快卡，组成高大的集群。

除了NVIDIA、AMD，国产厂商也正在这方面全力繁芜，华为、摩尔线程、中科晨曦等皆是杰出代表。

近日，中科晨曦厚爱发并展示了scaleX万卡超等群，这亦然国产万卡基AI集群的初次真机亮相。

不同于华为紧闭式的全自研集群，中科晨曦scaleX万卡超集群旨在构建怒放、兼容、高密度的超大限制算力基础智商。

它守旧多品牌加快卡、主流探究生态，照旧适配优化400多个主流大模子、天下模子等，可用于大模子考验、金融风控、地质动力勘察、科学智能等各式场景。

中科晨曦scaleX万卡超集群由多个scaleX640超节点(单机柜640卡)、scaleFabirc高速蚁集互连而成，认为领有10240块加快卡，总算力异常5EFlops(500亿亿次每秒)。

HBM内存总容量异常650TB，总带宽异常18PB/s；片间互连总带宽异常4.5PB/s，柜间互连总带宽异常500TB/s。

单个超节点的基本组成是千卡级探究单位，接收“一拖二”高密架构瞎想，完竣单机柜640卡超高速一致性互连，双探究柜则组成1280卡探究单位。

散热方面，接收超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等多本领交融改革瞎想，成为业界超高集成度的液冷超节点。

全浸没式相变液冷本领，将工作器澈底浸在特制液体中，中间液体冷凝换热安装CDM的散热才调高达1.72MW(兆瓦)。

单机柜算力密度比较业界其他超节点最大擢升20倍，PUE值低至1.04。

公开信息涌现，中科晨曦子公司晨曦数创领有139项液冷有关专利，是国内惟一完竣大限制交易化液冷部署的企业。

蚁集方面，中科晨曦自研的scaleFabric蚁集芯片可提供400Gb/s的超高带宽、低于1微秒的端侧通讯蔓延、260ns的交换芯片转发延时，超节点间的通讯性能达到业内先进水平，比较传统的InfiniBand蚁集擢升2.33倍。

基于面向大限制组网优化的蚁集左券、超高交换容量的蚁集芯片、极致的链路可靠性优化，集群限制得以膨大到10万卡以上，同期蚁集总体资本裁减30％。

优化方面，超等地谈瞎想完竣了芯片级、系统级、应用级的三级协同优化，通过BurstBuffer、XDS等本领，大模子训推成果擢升30-40％，GPU垄断率擢升最多55％，同期还有AI应用亲和、AI数据加快。

可靠性方面，一体化、智能化的集群管控，可大大提高MTBF(平均故障隔绝时期)、裁减MTTR(平均故障设随即间)，集群永恒可用性达到99.99％，平均每30天的弗成用时期小于4分钟。