华为携手DeepSeek实现推理性能新高度

AI资讯2周前发布 ainav
61 0

# 升腾技术突破:DeepSeek-R1推理性能创历史新高!

## 一、技术报告亮点解读

### 1. 性能新标杆
– **单卡吞吐量**:在20 TPS(等效50ms时延)的稳定水平下,昇腾实现**单卡Decode吞吐突破1920 Tokens/s**,性能比肩H100。

### 2. 技术创新
– **大规模专家并行部署**:基于CloudMatrix 384超节点昇腾云服务和高性能推理框架SiliconLLM,采用最佳实践,正式上线DeepSeek-R1。

## 二、技术报告核心数据

| 场景 | 性能指标 |
|———————|———————-|
| 单卡Decode吞吐量 | 1920 Tokens/s |
| 处理能力 | 支持大规模专家并行 |
| 延迟约束下TPS | 20 TPS(50ms时延) |

## 三、活动预告:昇腾技术披露周

– **时间**:本周即将开启
– **内容亮点**:
– 深度技术分享与实践案例解析
– 最新技术动态与行业洞察
– **参与方式**:访问 [https://gitcode.com/ascend-tribe/ascend-inference-cluster](https://gitcode.com/ascend-tribe/ascend-inference-cluster) ,查看每日更新内容。

## 四、获取完整资料

### 技术报告下载:
[华为昇腾推理部署技术报告.pdf](https://gitcode.com/ascend-tribe/ascend-inference-cluster/blob/main/Overview/%E5%8D%8E%E4%B8%BA%E6%98%87%E8%85%BE%E6%9C%8D%E5%AE%9E_DeepSeek_V3_R1_%E6%8E%A8%E7%90%86%E9%83%A8%E7%BD%B2%E6%9C%80%E4%BD%B3%E5%AE%9E%E8%B7%B5.pdf)

### 技术博客阅读:
[昇腾推理集群技术概述.md](https://gitcode.com/ascend-tribe/ascend-inference-cluster/blob/main/Overview/ascend-inference-cluster-overview.md)

## 五、来源
本文改编自量子位《华为 + DeepSeek,推理性能创新高!技术报告也公布出来了》

© 版权声明

相关文章