4月11日,《科创板日报》发布消息指出,华为公司副总裁张修征在今日宣布,华为云CloudMatrix 384超节点将于今年上半年实现大规模部署,这一举措或将全面解决当前算力不足的问题。该技术未来将支持构建超过万片规模的集群,为用户提供强大的算力保障。
值得注意的是,在此之前的4月10日,华为云生态大会2025已在安徽芜湖圆满召开。会上,华为常务董事、华为云计算CEO张平安详细介绍了AI基础设施架构的最新进展,并正式推出了CloudMatrix 384超节点。这一创新技术已率先在芜湖数据中心实现了规模化应用。
据官方介绍,华为云CloudMatrix 384超节点实现了从服务器级到矩阵级的资源供给模式的重大突破,具备高密、高速、高效三大核心优势。通过在架构上的创新优化,该技术在算力、互联带宽和内存带宽等方面均达到了行业领先水平。
此外,华为云还持续对昇腾AI云服务进行优化升级。目前,其已全面适配包括DeepSeek在内的160多个第三方大模型,为大模型的训练和推理提供了可靠的算力保障,加速了行业应用的实际落地进程。同时,华为云盘古大模型已在30多个行业、400多个应用场景中实现广泛应用,涵盖城市治理、智慧金融、医疗健康以及气象预测等多个领域。
硅基流动公司宣布,已与华为云基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM展开合作。通过采用大规模专家并行的最佳实践,双方成功上线了DeepSeek-R1服务。
硅基流动表示,在保证单用户20TPS水平的前提下,该服务实现了单卡Decode吞吐量突破1920 Tokens/s,性能可媲美H100部署效果。同时,经过主流测试集的验证和大规模线上盲测,基于昇腾算力部署的DeepSeek-R1模型在精度上与官方标准保持一致。