华为CloudMatrix 384超节点大规模部署，彻底终结计算力焦虑

AI资讯1年前 (2025)发布 ainav

261 0 0

4月11日，《科创板日报》发布消息指出，华为公司副总裁张修征在今日宣布，华为云CloudMatrix 384超节点将于今年上半年实现大规模部署，这一举措或将全面解决当前算力不足的问题。该技术未来将支持构建超过万片规模的集群，为用户提供强大的算力保障。

值得注意的是，在此之前的4月10日，华为云生态大会2025已在安徽芜湖圆满召开。会上，华为常务董事、华为云计算CEO张平安详细介绍了AI基础设施架构的最新进展，并正式推出了CloudMatrix 384超节点。这一创新技术已率先在芜湖数据中心实现了规模化应用。

据官方介绍，华为云CloudMatrix 384超节点实现了从服务器级到矩阵级的资源供给模式的重大突破，具备高密、高速、高效三大核心优势。通过在架构上的创新优化，该技术在算力、互联带宽和内存带宽等方面均达到了行业领先水平。

此外，华为云还持续对昇腾AI云服务进行优化升级。目前，其已全面适配包括DeepSeek在内的160多个第三方大模型，为大模型的训练和推理提供了可靠的算力保障，加速了行业应用的实际落地进程。同时，华为云盘古大模型已在30多个行业、400多个应用场景中实现广泛应用，涵盖城市治理、智慧金融、医疗健康以及气象预测等多个领域。

硅基流动公司宣布，已与华为云基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM展开合作。通过采用大规模专家并行的最佳实践，双方成功上线了DeepSeek-R1服务。

硅基流动表示，在保证单用户20TPS水平的前提下，该服务实现了单卡Decode吞吐量突破1920 Tokens/s，性能可媲美H100部署效果。同时，经过主流测试集的验证和大规模线上盲测，基于昇腾算力部署的DeepSeek-R1模型在精度上与官方标准保持一致。

# AI资讯