华为携手DeepSeek实现推理性能新高度

AI资讯1年前 (2025)发布 ainav

353 0 0

# 升腾技术突破：DeepSeek-R1推理性能创历史新高！

## 一、技术报告亮点解读

### 1. 性能新标杆
– **单卡吞吐量**：在20 TPS（等效50ms时延）的稳定水平下，昇腾实现**单卡Decode吞吐突破1920 Tokens/s**，性能比肩H100。

### 2. 技术创新
– **大规模专家并行部署**：基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM，采用最佳实践，正式上线DeepSeek-R1。

## 二、技术报告核心数据

## 三、活动预告：昇腾技术披露周

– **时间**：本周即将开启
– **内容亮点**：
– 深度技术分享与实践案例解析
– 最新技术动态与行业洞察
– **参与方式**：访问 [https://gitcode.com/ascend-tribe/ascend-inference-cluster](https://gitcode.com/ascend-tribe/ascend-inference-cluster) ，查看每日更新内容。

## 四、获取完整资料

### 技术报告下载：
[华为昇腾推理部署技术报告.pdf](https://gitcode.com/ascend-tribe/ascend-inference-cluster/blob/main/Overview/%E5%8D%8E%E4%B8%BA%E6%98%87%E8%85%BE%E6%9C%8D%E5%AE%9E_DeepSeek_V3_R1_%E6%8E%A8%E7%90%86%E9%83%A8%E7%BD%B2%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.pdf)

### 技术博客阅读：
[昇腾推理集群技术概述.md](https://gitcode.com/ascend-tribe/ascend-inference-cluster/blob/main/Overview/ascend-inference-cluster-overview.md)

## 五、来源
本文改编自量子位《华为 + DeepSeek，推理性能创新高！技术报告也公布出来了》

# AI资讯