华为领先世界的超节点是啥 全球最强算力揭秘
在华为全联接大会2025上,华为轮值董事长徐直军分享了昇腾芯片的规划路线,并推出了全球最强超节点和集群。未来三年直至2028年,华为开发和规划了三个系列:Ascend 950、Ascend 960和Ascend 970。Ascend 950系列包括两颗芯片:Ascend 950PR和Ascend 950DT。
结合已推出或正在研发中的昇腾芯片,华为将带来更多超节点和集群产品,如Atlas 950超节点和Atlas 960超节点。Atlas 950超节点支持8192张昇腾卡,将在2026年四季度上市。而Atlas 960超节点最大可支持15488卡,预计于2027年四季度上市。
Ascend 950系列相比前一代,在多个方面实现了提升。新增支持FP8/MXFP8/MXFP4等低数值精度数据格式,算力分别达到1P和2P,提升了训练效率和推理吞吐。同时支持华为自研的HiF8热点话题,保持FP8高效的同时,精度接近FP16。向量算力也大幅提升,通过SIMD/SIMT双编程模型和内存访问优化实现。互联带宽提升至2TB/s。
Ascend 950PR主要面向推理Prefill阶段和推荐业务场景,计划于2026年一季度推出。Ascend 950DT则更注重推理Decode阶段和训练场景,支持FP8/MXFP8/MXFP4/HiF8数据格式,计划于2026年第四季度推出。Ascend 960将在2027年四季度推出,支持更多数据格式和更高带宽。Ascend 970计划在2028年四季度推出,各项指标将进一步升级。
从大型AI算力基础设施建设的技术方向看,超节点已成为主导性产品形态。今年3月,华为推出了Atlas 900超节点,满配支持384卡,最大算力可达300 PFLOPS。Atlas 950超节点支持8192张基于Ascend 950DT的昇腾卡,满配包括128个计算柜和32个互联柜,占地面积约1000平方米,FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s。华为领先世界的超节点是啥 全球最强算力揭秘 华为领先世界的超节点是啥 全球最强算力揭秘