千卡級計算單元,超強智能算力
采用"一拖二”高密架構(gòu)設(shè)計,實現(xiàn)單機柜640卡超高速總線互連,構(gòu)建大規(guī)模、高帶寬、低時延超節(jié)點通信域,雙scaleX640超節(jié)點組成1280卡計算單元,柜間通過高速網(wǎng)絡(luò)互連,液體冷凝換熱裝置CDM為千卡級計算單元提供高達1.72MW的超級散熱能力。
超越模型能源空間,利用效率極限
通過軟硬協(xié)同全局優(yōu)化,相比傳統(tǒng)架構(gòu),實現(xiàn)MOE大模型訓(xùn)練效率與高通量推理吞吐性能大幅提升30-40%;通過采用超高速正交架構(gòu),超高密度刀片、浸沒相變液冷、高壓直流供電等多技術(shù)融合創(chuàng)新設(shè)計,成為業(yè)界最高集成度的液冷超節(jié)點,單機柜算力密度相比業(yè)界其他超節(jié)點最大提升20倍,PUE值低至1.04。
硬件靈活多選,軟件無縫遷移
基于AI計算開放架構(gòu)設(shè)計,適配支持多品牌AI加速卡,為用戶提供更多靈活選擇;全面兼容主流AI計算軟件生態(tài),適配優(yōu)化400+主流大模型,支持AI模型、業(yè)務(wù)應(yīng)用快速無縫遷移與深度優(yōu)化 。
多級可靠性設(shè)計,十萬卡集群部署
從單機RAS特性到集群智能運維與故障恢復(fù)機制,采用多層級多維度可靠性設(shè)計,通過30天+長穩(wěn)運行可靠性測試驗證,保障十萬卡級超大規(guī)模集群擴展部署。